Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Ёфикация

Автор Квас, октября 8, 2011, 12:28

0 Пользователи и 1 гость просматривают эту тему.

Квас

Предположим, что имеется текстовый файл, содержащий русский текст и некую разметку. Существует ли простой способ проставить там буквы Ё? Вхождения слово «все» готов проверять вручную, но хотелось бы, чтобы остальное делалось автоматически. :)

Заранее спасибо.
Пишите письма! :)

Bhudh

А если там «елка» в значении «рот»?‥
А вообще, есть ста-арый макрос-ёфикатор для Ворда.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Квас

Цитата: Bhudh от октября  8, 2011, 12:30
А если там «елка» в значении «рот»?‥

Я готов проверять вручную не только слово «все», но и конечное число других слов. :yes:
Пишите письма! :)

Hellerick

А по ссылкам в вики вам ничего не нравится? ( (wiki/ru) Ёфикатор )

Абсурдность ёфикаторов в том, что они уверенно расставляют Ё только там, где она не нужна.

Bhudh

Цитата: http://ru.wikipedia.org/wiki/Ёфикатор...программ, выполняющих полную ёфикацию текстов в автоматическом режиме, не существует. Имеющиеся ёфикаторы либо работают интерактивно, в спорных случаях предоставляя выбор работающему с программой пользователю, либо заменяют «е» на «ё» только в бесспорных случаях («неполная» или «быстрая» ёфикация).
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

RawonaM

Цитата: Hellerick от октября  8, 2011, 12:35
Абсурдность ёфикаторов в том, что они уверенно расставляют Ё только там, где она не нужна.
Сильно сказано :) Вы хотели бы, чтобы программа понимала сама, что ей нужно подставить, там где даже человек не знает? Это еще дальше от нас, чем автоматический перевод.

Квас

Цитата: Hellerick от октября  8, 2011, 12:35
А по ссылкам в вики вам ничего не нравится? ( (wiki/ru) Ёфикатор )

О, спасибо большое!

Тема полностью раскрыта, можно с чистой совестью флудить.
Пишите письма! :)

RawonaM

Цитата: Квас от октября  8, 2011, 12:34
Я готов проверять вручную не только слово «все», но и конечное число других слов. :yes:
Между прочим (раз уже пошла флудилка), есть ли автоматические переводчики, которые работают в таком интерактивном режиме? Известно, что самая главная проблема — разрешение неоднозначностей, так почему бы эти случаи не спрашивать у человека?

Bhudh

Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

orang_baik

Разве существуют такие переводчики, за которыми не надо перепроверять? В любом случае человек участвует.

RawonaM

Цитата: orang_baik от октября  8, 2011, 12:44
Разве существуют такие переводчики, за которыми не надо перепроверять? В любом случае человек участвует.
Это не то. Не интерактивно. Нужно так: программа дает тебе на выбор несколько вариантов значения слова, которое сама не может понять, выбираешь правильный, дальше она сама продолжает, пока что-то непонятное не встретится.

Python

Интересно, вордовские макросы можно портировать во что-нибудь потоковое? Просто непосредственно с вордом мне дела иметь не приходится. Обычно проблема ё вылезает в программах для голосового воспроизведения текста, где она частично решается словарем.

Расстановка точек над ё в паре все/всё — ІМНО, самая важная и трудная проблема ёфикации. Расстановка вручную — не выход, слишком много править придется. Тем более, мне кажется, «всё» произносится чаще, чем «все». У себя в «Говорилке» я прописал чтение «все» как «всё» — вроде бы, режет слух чуть меньше (впрочем, это не решение).
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

orang_baik

Цитата: RawonaM от октября  8, 2011, 12:52
Цитата: orang_baik от октября  8, 2011, 12:44
Разве существуют такие переводчики, за которыми не надо перепроверять? В любом случае человек участвует.
Это не то. Не интерактивно. Нужно так: программа дает тебе на выбор несколько вариантов значения слова, которое сама не может понять, выбираешь правильный, дальше она сама продолжает, пока что-то непонятное не встретится.
Такую универсальную программу вряд ли возможно создать. Например, до начала перевода надо ей сообщить, что текст на определённую тематику. Тогда она будет выбирать значения слов, подходящие именно к данной теме. А на произвольном тексте она будет через слово переспрашивать.

RawonaM

Цитата: orang_baik от октября  8, 2011, 13:05
Такую универсальную программу вряд ли возможно создать. Например, до начала перевода надо ей сообщить, что текст на определённую тематику. Тогда она будет выбирать значения слов, подходящие именно к данной теме. А на произвольном тексте она будет через слово переспрашивать.
В любом случае это будет улучшать качество перевода. Сегодня программы претендуют на универсальность и без этой помощи человека, что еще хуже.
А по ходу переспрашивания слов она должна будет потихоньку догадываться о тематике текста и в конце перестать спрашивать о словах, хотя конечно двусмысленных форм и конструкций не уменьшится, это будет только лексики касаться.

Hellerick

Насколько я понимаю, с расстановкой Ё скорее понадобится не понимание тематики, а понимание грамматики.

RawonaM

Цитата: Hellerick от октября  8, 2011, 13:15
Насколько я понимаю, с расстановкой Ё скорее понадобится не понимание тематики, а понимание грамматики.
Иногда и тематики. "Какое небо голубое..."

Python

Иногда не работает ни то, ни другое. «Они все знают».
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Oleg Grom

Цитата: RawonaM от октября  8, 2011, 13:18
"Какое небо голубое..."
Голубое њобо? Такое словосочетание вообще бывает?

Hellerick

А чтобы правильно написать «Турция признает Абхазию» нужно еще и следить за новостными сайтами.

Bhudh

Можно просто прописа[b]́[/b]ть ударение.
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Python

Без ударений обходятся даже те, кто упорно пишет ё. К тому же, в неюникодовском тексте ударение вообще недостопны.
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

Bhudh

В текстах для голосовых движков ударение обозначается < после буквы, если мне склероз не изменяет. Или наоборот...
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Demetrius

Цитата: Bhudh от октября  8, 2011, 17:58
В текстах для голосовых движков ударение обозначается < после буквы, если мне склероз не изменяет. Или наоборот...
Никакого стандарта нет. В&nbsp;белорусском речевом движке, с&nbsp;которым мы на практике работали, ударение обозначалось знаком + или (вторичное) = после буквы.

Bhudh

Цитата: Demetrius от В белорусском речевом движке
обожемой
А вы хотели, чтобы они западный стандард копировали?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Demetrius

Цитата: Bhudh от октября  8, 2011, 18:58
Цитата: Demetrius от В белорусском речевом движке
обожемой
А вы хотели, чтобы они западный стандард копировали?
Это не стандарт. Стандарта нет, западного тоже.

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр