RU/Справочник по формам множественного числа в KDE

From KDE Community Wiki
< RU

С 20 июля 2010 года русский перевод KDE (стабильной и нестабильной ветвей) переведён на новую формулу работы с формами множественного числа (тождественную той, которая используется в сербском языке):

Plural-Forms: nplurals=4; plural=n==1 ? 3 : n%10==1 && n%100!=11 ? 0 : n%10>=2 && n%10<=4 && (n%100<10 || n%100>=20) ? 1 : 2;\n

Соответствие чисел в сообщении номерам форм множественного числа:

0: для чисел 21, 31, 41 ... ,
1: для чисел 2, 3, 4, 22, 23 ... ,
2: для чисел 5, 6, 7 ... ,
3: для числа 1.

На этой странице вы можете найти ответы на самые распространённые вопросы, связанные с переходом.

Зачем?

Каковы причины перехода?

Рассмотрим пример. Пусть надо перевести на русский такую комбинацию сообщений (digiKam):

msgid "You have edited the image caption. 
msgid_plural "You have edited the captions of %1 images"

Предыдущая формула записи форм множественного числа предоставляла возможность использовать для перевода три формы:

0: для 1, 21, 31, 41 ... подписи 
1: для 2, 3, 4, 22, 23 ... подписей 
2: для 5, 6, 7 ... подписей. 

Типичной ошибкой, которую совершают как опытные, так и начинающие переводчки, является такой перевод:

msgstr [0] "Вы изменили подпись к снимку."
msgstr [1] "Вы изменили подписи к %1 снимкам." 
msgstr [2] "Вы изменили подписи к %1 снимкам."

Простая проверка msgfmt -v -c digikam.po показывает, что такой перевод является некорректным с точки зрения gettext. Почему?

Вы, наверно, уже догадались: нулевая форма описывает не один, а бесконечно много вариантов. У нас же описан пока лишь перевод для единственного числа. Для исправления этого недостатка приходилось делать так:

msgstr [0] "Вы изменили подпись к %1 снимку."
msgstr [1] "Вы изменили подписи к %1 снимкам." 
msgstr [2] "Вы изменили подписи к %1 снимкам."

Выглядит неуклюже (пользователю будет показана чрезмерная информация в случае 1 подписи), но работает.

Немного видоизменённый пример:

msgid "You have edited the image caption." 
msgid_plural "You have edited the captions of images"

Теперь любой перевод по старой формуле будет иметь ложные варианты:

msgstr [0] "Вы изменили подпись к снимку."
msgstr [1] "Вы изменили подписи к снимкам." 
msgstr [2] "Вы изменили подписи к снимкам."

Ошибка: подписей может быть 21, а это отнюдь не «подпись».

msgstr [0] "Вы изменили подписи к снимкам."
msgstr [1] "Вы изменили подписи к снимкам." 
msgstr [2] "Вы изменили подписи к снимкам."

Ошибка: подписей может быть 1, а это отнюдь не «подписи».

msgstr [0] "Вы изменили подпись к %1 снимку."
msgstr [1] "Вы изменили подписи к %1 снимкам." 
msgstr [2] "Вы изменили подписи к %1 снимкам."

Ошибка: формально работает, но не проходит проверку msgfmt.

Новая формула лишена недостатков предыдущей. С ней мы можем чётко отмежевать единственное число от всех других случаев:

msgstr [0] "Вы изменили подписи к %1 снимку."
msgstr [1] "Вы изменили подписи к %1 снимкам." 
msgstr [2] "Вы изменили подписи к %1 снимкам."
msgstr [3] "Вы изменили подпись к снимку."
msgstr [0] "Вы изменили подписи к снимкам."
msgstr [1] "Вы изменили подписи к снимкам." 
msgstr [2] "Вы изменили подписи к снимкам."
msgstr [3] "Вы изменили подпись к снимку."

Чтобы легче было разобраться, приведём таблицу соответствия вкладок Lokalize количественным числительным в сегментах перевода:

Соответствие вкладок Lokalize формам множественного числа
Номер вкладки Количество
1 21, 31, 41...
2 2, 3, 4, 22, 23, 24...
3 5, 6, 7, 8...
4 1

Почему такой порядок форм? Не было бы логичнее использовать единственное число для формы [0]?

Дело в том, что в редакторах (Virtaal) и некоторых системах перевода (Launchpad/Rosetta) количество форм жёстко зашито в код. Таким образом, четвёртая (новая форма) будет обрезана при импортировании без каких-либо предупреждений. Если переставить форму [3] на место формы [0], мы получим результат, который, как уже упоминалось выше, не проходит проверки утилитами gettext и сценариями Rosetta.

Как перейти на новую формулу?

Часлав Илич (координатор сербской команды KDE) предоставил скрипт, который работает на основе оболочки обработки переводов KDE Pology:

#!/usr/bin/env python2
# -*- coding: UTF-8 -*-

import fallback_import_paths
import os
import sys

from pology.catalog import Catalog
from pology.fsops import collect_catalogs
from pology.report import report, error

cmd = os.path.basename(sys.argv[0])
args = sys.argv[1:]
if len(args) != 3:
    error("Usage: %(cmd)s PATH PLURALFORMS COPYMAP" % dict(cmd=cmd))
path = args.pop(0)
newplhead = args.pop(0)
copyspec = args.pop(0)

# Process form mapping.
srcforms = set()
dstforms = set()
copymap = {}
for spec1 in copyspec.split(","):
    try:
        sform, dform = map(int, spec1.split(">"))
    except:
        error("Malformed copy map '%(map)s'." % dict(map=copyspec))
    copymap[sform] = dform
    srcforms.add(sform)
    dstforms.add(dform)
if max(srcforms) + 1 != len(srcforms):
    error("Gaps in source forms.")
if max(dstforms) + 1 != len(dstforms):
    error("Gaps in destination forms.")
copyord = [0] * len(dstforms)
for sform, dform in copymap.items():
    copyord[dform] = sform

# Convert catalogs.
for popath in collect_catalogs(path):
    cat = Catalog(popath)
    cat.header.replace_field_value(u"Plural-Forms", unicode(newplhead))
    for msg in cat:
        if msg.msgid_plural is not None:
            msg.msgstr[:] = [msg.msgstr[x] for x in copyord]
    if cat.sync():
        report(cat.filename)

Чтобы перевести ваши переводы на новую формулу, загрузите Pology, сохраните скрипт в подкаталог scripts и выполните команду:

./modplforms.py /путь/к/каталогу/переводов  'nplurals=4; plural=n==1 ? 3 : n%10==1 && n%100!=11 ? 0 : n%10>=2 && n%10<=4 && (n%100<10 || n%100>=20) ? 1 : 2' '0>0,1>1,2>2,0>3'

В результате в поле четвёртой формы попадёт копия того, что было в первой. Изменённые переводы не будут отмечены как неточные, следовательно никаких неудобств возникнуть не должно.

Файлы *_qt.po

Некоторые библиотеки и программы от KDE используют систему перевода, встроенную в Qt, и она поддерживает только традиционные 3 формы множественного числа для русского языка. Для удобства файлам шаблонов и переводов (.pot/.po) дают имена вида *_qt.po. Таким образом, если переводчик видит "_qt.po" в конце имени файла, он может сделать вывод, что в переводе будут доступны для заполнения три формы множественного числа.

Что дальше?

Эксперименты показывают, что дополнительная четвертая форма обрезается без сообщений об ошибке Virtaal и Rosetta. Поэтому пользователи *buntu смогут видеть три формы предыдущей формулы. Резкий переход невозможен потому, что в Rosetta нет внутренних механизмов, обеспечивающих беспроблемную смену количества форм множественного числа.

Все остальные дистрибутивы, которые используют коды, предлагаемые для использования непосредственно командой KDE, смогут воспользоваться преимуществами нового формата.

Transifex, poEdit и Lokalize понимают новую формулу без проблем.

Безусловно, команда переводчиков KDE будет рада помочь всем, у кого возникнут вопросы, касающиеся новой формулы, поскольку, очевидно, проблемы, приведшие к переходу, существуют во многих рабочих средах (GNOME, XFCE...) и отдельных программах (Inkscape, Shotwell...).