Как расставить переносы в азиатских языках

Frame 14110

Когда мы пишем тексты на русском или английском языке, не возникает вопросов, как правильно переносить слова на новую строчку. Более того, обычно мы даже не замечаем, как это происходит — текст самостоятельно адаптируется под размеры окна. Эта функция в большинстве программ называется text-wrapping. 

Но как быть с азиатскими языками, в которых вместо привычных для нас букв — иероглифы? Мы расскажем, как правильно расставить переносы в китайском, японском, тайском или корейском, чтобы носители читали текст без возмущений. 

Как компьютеры расставляют переносы

В европейских языках компьютеру легко расставить переносы, а людям проверить, насколько хорошо у него это получается. Это возможно благодаря тому, что в западных языках слова разделяются пробелами. Чтобы слова оставались целыми, а тексты читаемыми, достаточно, чтобы переносы появлялись лишь там, где в тексте стоят пробелы.

Неправильный перенос слова achievements в англоязычной версии текста

Когда дело касается иероглифов, оценить правильно ли перенесся текст становится в разы сложнее — особенно, если вы не являетесь носителем языка. Практически невозможно понять, все ли в тексте на своих местах. 

Сможете определить, правильно ли расставлены переносы в этом тексте?

Испытывать сложности с переносами в азиатских языках вполне нормально — это непривычный формат написания текста. Но изучить особенности расставления переносов в этой группе необходимо, чтобы уберечь себя от ошибок. Давайте сделаем это вместе. 

Корейский

Здесь дела обстоят проще, чем в любых других восточных языках. Текст в корейском делится на слова при помощи пробелов, что уже позволяет легко определиться с местом для возможного переноса. Не будет ошибкой даже случай, если вы сделаете перенос внутри слова, расположив его части на разных строках. Однако не забудьте, что слова нельзя отделять от знаков препинания, которые за ними следуют. 

Впрочем, из этих правил есть исключения. Например, некоторые игровые сторы требуют переносить слова исключительно по пробелам, объясняя это лучшей читабельностью. Из тех же соображений лучше не оставлять одиночные корейские символы на отдельной строке. 

Неправильные переносы
Правильные переносы

Китайский 

Если ваше программное обеспечение при переносе текста ориентируется на пробелы, то возникнут проблемы. Дело в том, что в китайском их просто не существует. Текст на странице располагается неразрывными строками, в которых минимальная единица — не слово, а знак (иероглиф). 

Если в русском или английском мы можем перенести слова правильно, опираясь на разделение по пробелам и знакам препинания, то в китайском нам понадобится словарь и оценка контекста — никаких пробелов, как мы уже выяснили, здесь нет. 

Слово может состоять как из двух, так и из пяти иероглифов. Если вы не знаете содержания, то довольно сложно определить, в каком месте их можно разорвать, чтобы это не сказалось на понимании текста. Но это не так страшно, потому что в китайском нет строгих правил, которые требуют переносить текст только по словам. 

А вот в работе со знаками препинания ограничения есть: 

  • Нельзя использовать точки, запятые, закрывающие скобки, восклицательные и вопросительные знаки в начале строки;
  • Запрещается оставлять открывающие скобки и кавычки, а также значки валют в конце строки; 
  • Не следует разрывать двойные знаки препинания — например, традиционные для китайского языка двойные тире или многоточия;
  • Необходимо слитное написание числительных с префиксами и постфиксами.

Хотя в китайском и нет строгих требований к переносу слов, все же расстановка переносов довольно ощутимо влияет на легкость чтения текста и его эстетику. Поэтому хотя бы для маркетинговых текстов стоит осмысленно делить китайский текст по строкам. 

Как минимум:  

  • Не разрывать пополам значимые слова, имена и названия;
  • Не оставлять висящими эмфатические усиливающие частицы.
Неправильные переносы
Правильные переносы

Это можно сделать вручную, если под рукой есть человек, знающий китайский и готовый расставлять в тексте знаки переносов, или автоматически — с помощью специальных программ. Как правило, они пишутся компаниями самостоятельно — с учетом особенностей языка.

Японский

Японская письменность тоже не использует пробелы для разделения слов. Как и в китайском, текст переносится не по словам, а по знакам. Все это делает схожими и проблемы, и способы их решения.  

Стоит отметить, что в японском чаще, чем в китайском, переносы расставляются с оглядкой на границы слов. Возможно, это связано с разницей в грамматике. В китайском слова практически никогда не меняются, а в японском есть суффиксы, имеющие грамматическое значение. Их отрыв от корня может затруднить понимание, поэтому правильные переносы в японском более важны для восприятия текста.

Написать программу, которая хорошо расставит переносы в японском тексте автоматически сложно. Потребуется не только словарь, но и прописанные правила, связанные с возможным изменением слов и наличием суффиксов. 

Если у вас нет возможности обратиться к носителю за проверкой переносов, лучшим решением будет оставить стандартные — по знакам. Текст скорее всего будет понятен, даже если возникнут сложности с эстетической точки зрения. 

Правда важно, чтобы при этом соблюдались те же правила, что и в китайском языке: например, строки не должны начинаться с точек и заканчиваться открывающими скобками. 

Неправильные переносы
Правильные переносы

Тайский

Для тайского не существует простых и в то же время достаточно хороших решений. Здесь работает строгое правило: текст должен переноситься по словам. Но найти границы слов не так просто: хотя в тайском используются пробелы, они располагаются не на границах слов, а на границах значимых частей предложений. 

Неправильные переносы
Правильные переносы

Это означает, что не сработает ни стандартная европейская схема с переносом по словам, ни стандартная восточно-азиатская схема с переносом по символам. Почти наверняка тайская локализация будет отображаться некорректно, если не обозначить в тексте конкретные места, где текст можно переносить. Для этого используют специальные символы-теги. 

Такими же особенностями обладают лаосский и кхмерский языки. Лучшим решением в данном случае является использование автоматического токенизатора и последующая проверка носителем языка.

Оставайтесь с нами, чтобы прочитать об особенностях перевода на разные языки, посмотреть интервью с профессионалами индустрии и ознакомиться с кейсами локализации реальных проектов — обо всем этом в нашем блоге.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *

Поделиться
Поделиться
Tвитнуть