Перейти до основного вмісту
eLearner.app
Модуль 7 · Урок 4 із 428/32 у курсі~10 min
Модульні уроки (4/4)

Розділити за допомогою регулярного виразу

String.prototype.split(separator) accepts not only a fixed string but also a regex as separator. This makes it a powerful tool to tokenize structured text.

JS
'uno, due,tre  quattro'.split(/[,\s]+/);
// ["uno", "due", "tre", "quattro"]

The regex /[,\s]+/ matches "one or more of comma or whitespace": split splits on any compound delimiter.

Typical cases

  • Permissive CSV: text.split(/\s*,\s*/) to handle spaces around commas.
  • Naive tokenizer: text.split(/\s+/) to extract words.
  • Keep the separator: if the regex contains capturing groups, the content of the groups is included in the result array.
JS
'a=1; b=2; c=3'.split(/(;)\s*/);
// ["a=1", ";", "b=2", ";", "c=3"]

Without the () group the semicolon would disappear. With (;) you keep it in the result.

Preserving separators in split operations

If you place split separators inside capturing parentheses, the output of String.prototype.split will include the separators themselves as elements in the final array, instead of discarding them.

Try it

вправи#regex.m7.l4.e1
Спроби: 0Завантаження…

Find every permissive CSV separator: a comma with optional spaces around it. This way you could use it in split to tokenize the list.

Завантаження редактора…
Показати підказку

Use \\s* before and after the comma to absorb any optional spaces.

Рішення доступне після 3 спроб

Review exercise

вправи#regex.m7.l4.e2
Спроби: 0Завантаження…

Find every 'spaces or semicolons' separator (one or more). This way split would tokenize the text into words.

Завантаження редактора…
Показати підказку

Combine \\s and ; in a class [\\s;] with the + quantifier.

Рішення доступне після 3 спроб

Additional challenge

вправи#regex.m7.l4.e3
Спроби: 0Завантаження…

Write a regex to use in a split that separates numbers while keeping math operators `+`, `-`, `*`, `/` as elements of the array.

Завантаження редактора…
Показати підказку

Enclose the math operators character class in capture parentheses to preserve them in the split array.

Рішення доступне після 3 спроб