Китайский язык — удивительный лингвистический феномен: один из древнейших и сложнейших в мире, он остается живым и очень распространенным. Из-за огромнейшей «армии» иероглифов (сегодня их насчитывается более 60 000) трудно представить, как выглядит китайская компьютерная клавиатура. Кажется, что она должна быть размером с Расписной стол из популярного сериала «Игра престолов» — тот представлял собой огромную карту государства, где происходит действие.
Внешний вид китайской клавиатуры
Но все не так страшно: на фото вы можете видеть, какая клавиатура у китайцев сегодня. Она стандартного, привычного нам размера. Обычная китайская раскладка клавиатуры с латинским аналогом QWERTY вполне устраивает современных китайцев: они неплохо справляются с вводом необходимого количества иероглифов. Да и не каждому требуются все, имеющиеся в языке — в обыденном лексиконе средний житель Китая использует всего около 3 000. Но удобная и эргономичная клавиатура появилась далеко не сразу — и все, как и в Европе, началось с печатных машинок.
Древние печатные машинки
На старых фото самые первые печатные машинки, созданные в Китае, действительно выглядят пугающе: ведь первый типографский набор включал в себя 9 000 иероглифов! И каждому из них соответствовал свой собственный печатный элемент. Основой конструкции таких машинок являлся своеобразный банк распространенных иероглифов, размещенный на специальной чернильной подушке. Над ним располагалась механическая часть, включающая держатель бумаги для печати в форме бобины, лапку для захватывания и рукоять для машиниста, двигающуюся вправо, влево и вперед. Остается только пожалеть машиниста, вынужденного то и дело передвигать всю эту махину ради распечатки одного-единственного иероглифа.
Принцип работы первой печатной машинки
Обилие мелких символов заставляло машиниста первой печатной машинки отыскивать нужный иероглиф, используя увеличительное стекло. Затем он перемещал на найденное весь механизм, нажимал на ручку, чтоб привести в действие лапку. Та по ходу движения захватывала и переворачивала требуемый иероглиф, оставляя его отпечаток на бумаге. Бумагоноситель слегка прокручивался, на бумаге появлялось местечко для следующего иероглифа.
Разумеется, это был трудозатратный и длительный процесс, и скорость набора текста была незначительна. Даже самый профессиональный машинист за минуту с трудом успевал напечатать 11 иероглифов.
Изобретение Линь Юйтана
Изобрести более практичную печатную машинку мог только человек, постоянно имеющий дело с языком. Так и случилось — революционное нововведение родилось в голове писателя и филолога Линь Юйтана в 1946 году. Он додумался поместить на клавиатуру составные части иероглифов — графемы. В центре машины Линь Юйтан расположил «окошко выбора», названное им «волшебный глаз»: после ввода сочетания клавиш в нем высвечивался предполагаемый тот или иной иероглиф. Чтоб подтвердить выбор, следовало нажать специальную клавишу-ключ. В общем у произведения Линь Юйтана имелось 64 клавиши, и за минуту устройство способно было печатать 50 знаков.
Изобретение разделило судьбу многих других за всю историю человечества — оно оказалось не ко времени. Линь Юйтан проживал тогда в США, где производство никому не нужной машинки с китайским шрифтом обходилось — и это для единственного экземпляра! — в 120 тыс. долларов. А на родине создателя, в Китае, шла гражданская война, и вряд ли Чан Кайши или Мао Цзэдун оценили бы в тот момент изобретение по достоинству. Когда Линь задумал продемонстрировать новшество американской компании «Ремингтон», оно невесть почему отказалось работать. Не судьба, иначе не скажешь…
Новая жизнь старого изобретения
Несмотря на так и не «ушедшую в народ» машинку Линь Юйтана, его идея не пропала зря: нужно было всего лишь дождаться массового внедрения компьютерных технологий. Стоило этому случиться, она пригодилась: была взята в качестве базы разработки методов ввода, основанных на структуре иероглифического письма.
Современные китайские клавиатуры
Сегодня большинство носителей языка печатает на совершенно обыкновенной клавиатуре. Это клавиатура с китайскими иероглифами, уже разбитыми на графические составляющие. Всего насчитывается более 200 графем, значит, одна клавиша соответствует 7-8 из них. Чтобы эффективно использовать эту клавиатуру, необходимо знать, из каких структурных элементов складываются конкретные иероглифы, и выучить их расположение.
Особенности расположения графем
Для неискушенного взора расположение структурных элементов на современной китайской клавиатуре представляется совершенно хаотичным. Но тут имеется определенная система — конечно, глазу европейца уловить этот порядок сложно. Вот что нужно усвоить:
- В зависимости от базовых элементов и их количества клавиши располагаются в одной из 5 зон.
- Все клавиши нумеруются от центра к краям.
- Как главный знак клавиши фигурирует один из 25 часто употребляемых иероглифов. Чтоб написать конкретно его, требуется четырежды нажимать на «его» клавишу.
- Состоящий из четырех графем иероглиф печатают, нажимая три клавиши в строгой очередности, и в последнюю очередь — четвертую.
Это кажется сложным? Если бы! Существуют ведь иероглифы, состоящие из двух или трех графем, также имеются графемы, отображаемые с помощью одного и того же сочетания клавиш. Чтобы различать их, создатели этой виртуальной клавиатуры вынуждены были изобрести особый двузначный код, где первая цифра — номер последней черточки иероглифа, вторая — его группа.
Разумеется, этот метод кажется излишне усложненным — он такой и есть. Но он неплохо работает: в минуту можно ввести целых 160 иероглифов! Правда, для этого потребуется понажимать на клавиши больше полумиллиона раз.
Структурные методы
Это методы, возникшие на основе разработок Линь Юйтана. Методов этих создано не меньше десяти, и все они используют деление иероглифов на четыре группы:
- с промежутком между графемами;
- с соединением графем;
- с пересечением либо наложением графем;
- и, наконец, 5 базовых черт и 25 наиболее распространенных иероглифов.
Уби цзысин («введение по 5 чертам») — наиболее популярный из данных методов.
Фонетические методы
Они, разумеется, стали доступными лишь после внедрения компьютерных технологий — ведь «разговаривать» с печатными машинками невозможно. Ваша задача — ввод иероглифа так, как он произносится, задача системы — отыскать нужное изображение. Вам остается только выбрать: ведь одинаково произноситься может десять и более разных иероглифов.
Самые популярные из фонетических методов:
- пиньинь (с использованием латинского алфавита);
- чжуинь (используется слоговая азбука с обозначениями, похожими на иероглифы).
СОВЕТ: Если вы планируете изучать китайский, помните, что пиньинь освоить проще всего.
Гибридные методы
Как следует из названия, эти — «помесь структурности и фонетики». Один из них называется иньсин (буквально «звук и вид»). Вводится иероглиф в транскрипции, затем указывается элемент графики (их немного на клавиатуре, и для запоминания это не сложно).
Но запомнить расположение элементов — самое меньшее, что требуется от пользователя. Чтоб грамотно и эффективно использовать метод, он должен отлично владеть транскрипцией и знать весьма сложную комбинаторику структурных систем. Поэтому гибридные методы не пользуются популярностью — проще освоить или то, или другое, но в совершенстве.
Так есть ли стандартный метод?
Методы, основанные на распознавании
Итак, ни один метод ввода с китайской клавиатуры нельзя назвать совершенным и абсолютно комфортным для пользователей. Но юзерам хочется именно удобства — поэтому появились разработки в области распознавания как речи, так и ввода в рукописном виде.
СОВЕТ. Оба вида распознавания имеются в стандартной версии Asian Language pack Windows 7. Если хотите воспользоваться этой опцией, система должна потратить хотя бы четверть часа на обучение, чтоб «приноровиться» к нюансам вашего почерка и произношения.
Однако «распознавательные» способы в китаеговорящей среде все-таки не обрели широкой популярности, пользователи по-прежнему печатают на «клаве» и полагают это более надежным способом.
СОВЕТ. Если вы изучаете язык, то учтите — этот метод весьма активно используют онлайновые словари.
Блог компании ABBYYВы, вероятно, представляли ее себе как целый орган — грандиозное сооружение длиной в пару метров с сотнями и тысячами клавиш. На самом деле, большинство китайцев используют обычную клавиатуру с латинской раскладкой QWERTY. Но как с помощью нее можно набрать такое несметное количество различных иероглифов? Мы попросили рассказать об этом нашу сотрудницу Юлию Дрейзис. Ее с Китаем связывают и давняя любовь, и работа.
История вопроса: печатные машинки
За несколько тысяч лет хитроумные китайцы успели довести количество иероглифов до 50000 с хвостиком. И хотя число нужных в повседневной жизни знаков не измеряется десятками тысяч, все равно, как ни крути, стандартный набор старой типографии — 9000 литер. Долгое время набор осуществлялся по принципу «на каждый иероглиф — отдельный печатный элемент». Поэтому работать приходилось с машинками-монстрами вроде такой:Печатная машинка фирмы «Шуангэ», 1947 год (принцип действия придуман японцем Киота Сугимото в 1915 году).Основной ее элемент — банк иероглифов, находящихся на чернильной подушке. Над иероглифами закреплена механическая система: рукоятка, «лапка» для захвата и бобина с листом бумаги. Весь механизм вместе с бобиной вслед за рукояткой способен перемещаться влево, вправо, вперёд и назад за счет усилия машиниста. Чтобы набрать текст, машинист долго ищет с лупой нужный иероглиф, помещает над ним систему и нажатием на ручку приводит в действие «лапку», которая хватает иероглиф и на ходу, разворачивая, отпечатывает его на листе бумаги. При этом бобина с листом немного проворачивается, предоставляя место для следующего символа. Разумеется, процесс печати на таком агрегате выходит крайне медленным — опытный оператор мог набирать не более 11 иероглифов в минуту. В 1946 году известный китайский филолог Линь Юйтан предложил вариант печатной машинки, построенной на совершенно новом принципе — разложении иероглифов на составные части.Электромеханическая печатная машинка Линь Юйтана, 1946 г. В отличие от габаритных предшественниц, новая машинка была ничуть не больше своих латинских аналогов, да и клавиш на ней было немного. Дело в том, что клавиши соответствовали не иероглифам, а их составным частям. В центре устройства находился «волшебный глаз»: когда машинист нажимал комбинацию клавиш, в «глазе» появлялся вариант иероглифа. Чтобы подтвердить выбор, нужно было нажать дополнительный функциональный ключ. При наличии всего 64 клавиш такая машинка легко могла обеспечить набор 90,000 знаков и скорость 50 знаков в минуту! Хотя Линь Юйтан умудрился получить на свое изобретение патент в США, в массы оно так и не пошло. Неудивительно, ведь производство одного такого аппарата стоило на тот момент порядка 120,000 долларов. К тому же в день, когда была назначена презентация для компании «Ремингтон», машинка отказалась работать — даже волшебный глаз не помог. Идею благополучно отложили до лучших времен. Зато в эру широкого распространения компьютеров идея Линь Юйтана о разложении иероглифов на составные части обрела новую жизнь. Она легла в основу структурных методов ввода китайских иероглифов, о которых мы сейчас и поговорим. (Кстати, в 80-е годы тайваньская компания MiTAC даже разработала непосредственно на основании системы кодирования Линь Юйтана свой метод структурного ввода — Simplex.)
Структурные методы
Таких методов известно не меньше десятка, и все они основаны на графической структуре иероглифа. Китайские иероглифы — это паззлы, собираемые из одних и тех же частей (т.н. графем). Количество этих графем не так уж велико — 208, и их уже можно «запихнуть» в обычную клавиатуру. Правда, получится около 8 графем на одну клавишу, но эта проблема легко решается. Один из самых распространенных методов структурного ввода — уби цзысин (Wubing zixing — «ввод по пяти чертам»). Как же он работает? Сразу предупреждаю: сложно. На самом деле все китайские иероглифы делятся на четыре группы:
- Базовые 5 черт (一, 丨, 丿, 丶, 乙) и еще 25 очень часто употребляемых иероглифов (каждому из них сопоставлена клавиша).
- Иероглифы, между графемами которых есть определённое расстояние. Например, иероглиф 苗 состоит из графем 艹 и 田, между которыми есть расстояние (хотя на печати они немного «спрессовываются» и вам может показаться, что расстояния между ними нет).
- Иероглифы, графемы которых соединены друг с другом. Так, иероглиф 且 представляет собой графему月, соединённую с горизонтальной чертой; 尺 состоит из графемы 尸 и откидной черты.
- Иероглифы, графемы которых пересекаются либо накладываются друг на друга. Например, иероглиф 本 — это пересечение графем 木 и 一.
Ну вот, мы мысленно разбили иероглиф, который собираемся ввести, на графемы. Что дальше? Сначала посмотрим на раскладку уби: На первый взгляд может показаться, что графемы расположены беспорядочно. На самом деле это не так. Клавиатура разбита на пять зон, по числу базовых черт, (на рисунке они отмечены разными цветами). Внутри каждой зоны клавиши пронумерованы — от центра клавиатуры к краям. Номер составляется из двух цифр от 1 до 5 — в зависимости о того, из каких базовых черт собирается графема. Ну что ж, начнём с самых простых для ввода графем — заглавных графем каждой клавиши (они выделены крупным шрифтом в таблице). Каждая из них представляет собой один их 25 часто употребляемых иероглифов, о которых шла речь выше. Чтобы ввести такой иероглиф, достаточно нажать четыре раза на соответствующую клавишу. Выходит, что 金=QQQQ, 立=YYYY и т. п. Таким образом, 毅=U+E+M+C. Для ввода иероглифов, состоящих более чем из четырёх графем, нужно ввести первые три графемы и последнюю. Сложнее всего вводить иероглифы, состоящие из двух или трёх графем. Поскольку их очень много, то неизбежно появятся несколько иероглифов, претендующих на одну и ту же комбинацию клавиш. Чтобы их различать, разработчики придумали специальный код. Этот код состоит из двух цифр, первая — порядковый номер последней черты иероглифа, а вторая — номер группы иероглифа (вспомните четыре группы, на которые разделяются иероглифы). К счастью, при наборе большинства часто используемых иероглифов не придётся думать о кодах, потому что иероглифы будут появляться на экране уже после первых двух или трёх нажатий. А 24 наиболее часто встречающихся знака можно и вовсе ввести одним нажатием (им поставлены в соответствие клавиши). Недостатки структурного ввода очевидны: он сложный — выше была только дайджест-версия его описания! Чтобы освоить его, китайцы даже специальный мнемонический стишок придумали. Зато структурный метод открывает возможность слепого ввода, что повышает максимальную скорость набора до 160 символов в минуту. Поэтому профессиональные наборщики используют именно его. И не забываем: 160 иероглифов в минуту — это около 500 нажатий клавиш за ту же минуту! Для структурного ввода чаще всего используют самую обычную клавиатуру QWERTY — ведь расположение иероглифов на ней все равно приходится учить. Но иногда можно встретить и вот такие клавиатуры с графемами на клавишах: Правда, я за все свое время пребывания в Китае таких клавиатур не видела 🙂
Фонетические методы
Печатных машинок, использующих эти методы набора, попросту не существует — своим появлением фонетические методы обязаны исключительно компьютерам. Ведь используя фонетический метод, вы вводите не сам иероглиф, а его произношение — и система уже находит нужный иероглиф. Но вот проблема: в китайском языке столько знаков, что одному и тому же произношению могут соответствовать десятки иероглифов. Нужный иероглиф, как правило, приходится выбирать вручную из списка, что делает процесс ввода довольно медленным. На помощь приходят предиктивные системы наподобие T9. Наиболее распространенный фонетический метод — знаменитый пиньинь (Pinyin). На его основе построена система фонетического ввода, которая входит в стандартный Asian Language Pack системы Windows (начиная с версии XP — до этого ее приходилось ставить дополнительно). Посмотрим, как она работает. Например, мы хотим ввести слово «блоггер» — ванминь. Набираем сначала wang (или wang3 с указанием тона, чтобы уменьшить количество вариантов). После нажатия пробела подставляется иероглиф с чтением ван. Но это не тот ван, что нам нужен. Жмем на него правой кнопкой: Вылезает длинная строка соответствий. Мы можем, ломая глаза, искать там наш ван или просто ввести второй слог слова — min. Система умная — она сама найдет в словаре слово ванминь и автоматически выберет нужный ван и нужный минь. Банзай, мы сделали это! Системы ввода Google Pinyin и Sogou Pinyin пошли дальше — они запоминают пользовательские предпочтения и подсказывают на основании контекста нужные слова. Вот пример того, как Google Pinyin анализирует, казалось бы, зубодробительную последовательность и выдает правильный вариант набора:Я видел, как Ван Чжичжи играл в одном матче с Яо Мином (речь идет о двух китайских баскетболистах NBA). Особенно приятно, что имена написаны правильно. На Тайване существует и альтернатива пиньинь-системе — ввод по чжуинь (Zhuyin). Используется не латинский алфавит, а слоговая азбука cо значками наподобие иероглифов. Поскольку значков в азбуке немного, их легко раскидать по клавиатуре. В Гонконге есть свой вариант романизации для местного диалекта — ютпхин (Jyutping), он тоже активно используется для фонетического ввода. Основным недостатком систем фонетического ввода является довольно низкая скорость печати — около 50 знаков в минуту (сравните с уби цзысин с его 160 знаками в минуту). Дело в том, что ввод иероглифа по методу пиньинь происходит, в среднем, за шесть нажатий клавиш, тогда как при вводе по уби цзысин будет достаточно четырех. К тому же, слепой набор данным методом невозможен. И потом, нужно знать пиньинь/чжуинь, что далеко не всякому китайцу подходит, потому как с первого класса школы знания (если и были) успели немножко подвыветриться. Да и не всегда легко вспомнить, как читается какой-нибудь редкий иероглиф. Поэтому в Китае всё большую популярность набирает уби цзысин. Тем не менее, пиньинь выучить все равно проще, чем структурные методы. Ну а иностранцу такая система просто как бальзам на душу. Как мы видим, для фонетического ввода нам также не потребуется какая-то специальная клавиатура — достаточно любой клавиатуры с латинской раскладкой QWERTY. Ну, например, вполне подойдет та, которая находится перед вами 🙂
Гибридные методы
Эти методы представляют собой некую комбинацию фонетических и структурных методов ввода. Простейший пример — метод иньсин (Yinxing — «звучание и форма»). Иероглиф набирается путем ввода транскрипции и указания на графический элемент. Ограниченный набор графических элементов разнесен по клавиатуре, так что запомнить их теоретически не сложно. На практике системы гибридного ввода постепенно вымирают. Они требуют от пользователя одновременно знания сложной комбинаторики структурных систем и хорошего владения транскрипцией. Проще уж освоить в совершенстве что-то одно.
Так есть ли «стандартный» метод?
А вот и нет. В КНР наибольшей популярностью пользуются структурный метод уби и фонетический пиньинь. На Тайване любят фонетический метод чжуинь (поскольку многие учили в школе именно его, а не пиньинь) и морально устаревший структурный метод цанцзе (Cangjie). Он был изобретен еще в 1976 г. и сохранил с тех пор все свои недостатки: этим методом очень сложно вводить пунктуационные знаки, нужно всегда угадывать правильный способ разбивки иероглифа и помнить сложную раскладку (многие тайваньцы даже наклеивают ее от безысходности на монитор). В Гонконге цанцзе учат в школе и явно предпочитают его всем остальным методам.
Методы, основанные на распознавании
Получается, что ни один из перечисленных методов клавиатурного ввода не является идеальным. Неудивительно, что китайцы решили уцепиться за свою последнюю надежду — распознавание. Сейчас распознавание как речи, так и рукописного ввода входит в стандартный Language pack Windows 7. Предполагается, что перед использованием лучше перевести систему в «обучающийся режим» как минимум минут на 15, чтобы дать ей время привыкнуть к вашему почерку и особенностям речи. Но методы, основанные на распознавании, так и не получили широкого распространения. Ввод с помощью клавиатуры по-прежнему считается более надежным. Распознавание устного китайского осложняется тем, что не так велика доля людей, говорящих с идеальным произношением. Диалектные особенности вылезают то тут, то там и портят всю картину. Об иностранцах, для которых освоить четыре тона — уже подвиг, и говорить не приходится. Рукописный ввод иероглифов представляется делом попроще, к тому же сейчас существует множество PDA, поддерживающих этот метод ввода. Но и этот метод не достиг широкого применения. Дело в том, что китайцы в большинстве своем пишут нечленораздельным курсивом и перестроиться на медленное вырисовывание каждой черты им бывает сложно. Часто проблема в том, что они просто не помнят нормальный порядок черт, потому что привыкли писать сокращенные формы! Вот и выходит, что ввод, основанный на распознавании, годится в основном для изучающих язык, чем активно пользуются онлайн-словари. Например, на сайте популярного Nciku всем желающим предлагается нарисовать нужный иероглиф с помощью мыши, а затем выбрать из предлагаемых системой вариантов:
И все-таки она существует!
Экспериментальная китайская клавиатура, бессмысленная и беспощадная. Ведь именно так вы ее себе представляли? Да, да, китайские клавиатуры с тысячами клавиш существуют. Правда по понятным причинам они не идут в серийное производство, оставаясь неким артефактом. Но, согласитесь, все-таки приятно осознавать, что такая клавиатура где-то есть! С Днем программиста! P.S. Другие мои статьи о китайском языке и китайской культуре вы можете прочитать в блоге команды Lingvo. (В статье использованы картинки с сайтов wikipedia.org и magazeta.com) Update: Юля Дрейзис теперь на Хабре — , просим любить и жаловать.
СЕРГЕЙ УЧВАТОВ рассказывает, как китайцы решили проблему набора текста, учитывая, что всего в языке — около 50 000 иероглифов.
Нам очень повезло, что наш родной язык — русский. В алфавите всего 33 буквы, которые умещаются на любой клавиатуре. Другое дело — китайский язык. Это один из самых сложных языков в мире — всего порядка 50 000 иероглифов. Конечно, в обычной жизни используются далеко не все, но всё равно очень много.. Так как же китайцы выходят из положения? Неужели их клавиатуры такие, какими их изображают на Пикабу?
Конечно, нет. Китайцы тоже пользуются стандартными по размеру клавиатурами, такими же, как и у нас. Но пришли они к этом не сразу. Первые их печатные машинки были просто адскими машинами. Например, печатная машинка «Шуангэ» середины прошлого века. Принцип её действия достаточно прост и основан на банке иероглифов, находящемся на чернильной подушке. Машинист должен был обладать дьявольским терпением: ему приходилось долго искать с лупой нужный иероглиф (каждому иероглифу в машине соответствовал отдельный знак), затем с помощью рукоятки привести в действие «лапу», которая «захватывает» нужный иероглиф и отпечатывает его на прикрепленном сверху листе бумаге. После этого бобина с листом немного смещается, освобождая место на листе для следующего символа. Как вы понимаете быстро печатать на такой машине не удавалось — по 10 иероглифов в минуту в лучшем случае.
Позже появились более удобные машинки, на которых клавиш было немного. Это удалось сделать за счет разложения иероглифов на составные части. Всего 64 клавиши! Устройство предполагало наличие специального «окошка», в котором появлялся тот или иной иероглиф в зависимости от нажатой машинистом клавиши. Если нужен был другой вариант в этом ряду, применялся специальный функциональный ключ, помогающий доопределить верный иероглиф. Несмотря на тот факт, что на такой машине тексты печатались гораздо быстрее, она в массы не ушла. В первую очередь, из-за своей дорговизны.
Однако структурный метод набора иероглифов (а это именно он) впоследствии стал применяться на компьютерных клавиатурах, дойдя до наших дней. Собственно, вси китайские иероглифы состоят из наборов одних и тех же графем, то есть составных частей. Всего 208 графем. Собственно, есть 5 базовых черт (дёЂ, дёЁ, дёї, дё¶, д№™) и 25 наиболее употребляемых иероглифов. Для всех них на клавиатуре есть отдельная клавиша. Есть еще несколько констант и правил китайского языка, благодаря которым набор иегроглифов на клавиатуре становится чуть проще. В любом случае, чаще всего для набора текста китайцам приходится по несколько раз нажимать на одну и ту же клавишу или использовать комбинации. Ну а что поделать, если китацем родился.
Конечно, есть еще фонетический способ набор текста. И гибридные, сочетающий в себе фонетический и структурный методы. Но в случае с китайским все способы сложны и требуют усидчивости и внимания. Если хотите пройти испытания, после которых вам уже всё будет по плечу, — начните изучать этот удивительный язык.
via
7Используемые источники:
- https://kitaygid.ru/tovary/kitajskaya-klaviatura
- https://m.habr.com/ru/post/104083
- https://pikabu.ru/story/kitayskaya_klaviatura_kak_muchayutsya_zhiteli_podnebesnoy_5045057