Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Синхронизация разноязычных субтитров

Автор usilitel, ноября 5, 2021, 15:17

0 Пользователи и 1 гость просматривают эту тему.

usilitel

Есть 2 файла с субтитрами: на английском и на русском языке.
Нужно написать программу (или найти готовую), которая всем фразам из файла с английскими субтитрами соспоставит фразы из файла с русскими субтитрами.
Проблема в том что:
1) время английских и русских субтитров немного отличается, т.е. отдельные фразы могут быть сдвинуты вперёд/назад относительно друг друга.
2) фразы на английском языке могут быть разбиты на 2 фразы на русском, или наоборот.

Пробовал решить проблему "в лоб" (искал ближайшие по времени фразы) - работает плохо, т.к. когда фразы стоят близко друг к другу - то ближайшее время может соответствовать другой фразе.

Кто-нибудь сталкивался с подобной проблемой? Может быть уже есть готовое решение? Не хочется велосипед изобретать.
Или может подскажете в какую сторону копать?

Red Khan

Давным давно адаптировал субтитры для одних релизов фильмов к другим. Но там была проблема с таймингом, субтитры были для файла с другой частотой кадров (или что-то в этом роде). Возможно это ваш случай.

Если открыть файл с субтитрами в текстовом редакторе какие метки у субтитров? Время или кадры? Какой вообще у них формат, srt?

kemerover

Цитата: usilitel от ноября  5, 2021, 15:17
Пробовал решить проблему "в лоб" (искал ближайшие по времени фразы) - работает плохо, т.к. когда фразы стоят близко друг к другу - то ближайшее время может соответствовать другой фразе.
А есть пример конкретный?

Цитата: usilitel от ноября  5, 2021, 15:17
Кто-нибудь сталкивался с подобной проблемой? Может быть уже есть готовое решение?
Есть софт, который вставляет несколько субтитров в видео, если вам нужно конкретно это.


usilitel

Цитата: Red Khan от ноября  5, 2021, 23:23
Давным давно адаптировал субтитры для одних релизов фильмов к другим. Но там была проблема с таймингом, субтитры были для файла с другой частотой кадров (или что-то в этом роде). Возможно это ваш случай.

Если открыть файл с субтитрами в текстовом редакторе какие метки у субтитров? Время или кадры? Какой вообще у них формат, srt?

Формат srt (см. пример выше), отображается время. Но это некритично, я в принципе могу переделать так чтобы были кадры, это не проблема. Проблема в том что я пока не понимаю как в принципе эту проблему решить, какой тут алгоритм должен быть.
Подозреваю что придется делать перевод английских субтитров на русский и потом в русских субтитрах искать фразы наиболее похожие на переведённые.

Red Khan

Цитата: usilitel от ноября  6, 2021, 16:43
Формат srt
Для него есть куча редакторов. Я, ЕМНИП, пользовался Subtitle Workshop, там были возможности адаптировать субтитры под разную частоту кадров, автоматом смещать все субтитры на определённое время и т.п.

Цитата: usilitel от ноября  6, 2021, 16:43
пример выше
Один из скриншотов это самое начало же? Первый текст появляется в одно и тоже время (21,897) А вот у последнего разница уже 1,5 секунду, а предпоследнего уже почти три!

Просто чтобы не было допонимания - оба файла нормально "ложаться" на видео?

usilitel

Цитата: Red Khan от ноября  6, 2021, 19:16
Для него есть куча редакторов. Я, ЕМНИП, пользовался Subtitle Workshop, там были возможности адаптировать субтитры под разную частоту кадров, автоматом смещать все субтитры на определённое время и т.п.

Редактор не подойдёт, т.к. мне нужно автоматизированное решение.
То есть мне нужно написать программу, которая автоматически будет подгонять субтитры друг к другу, без участия человека. Просто мне нужно будет много субтитров подгонять, делать это вручную - не вариант.


Цитата: Red Khan от ноября  6, 2021, 19:16
Один из скриншотов это самое начало же? Первый текст появляется в одно и тоже время (21,897) А вот у последнего разница уже 1,5 секунду, а предпоследнего уже почти три!

Просто чтобы не было допонимания - оба файла нормально "ложаться" на видео?

Да, по-отдельности они плюс-минус нормально ложатся на видео. Возможно русская озвучка в некоторых местах сдвинута, поэтому и субтитры тоже сдвинуты.



В общем похоже придётся всё-таки велосипед изобретать. Пока думаю в сторону автоматизированного перевода.

Bhudh

Цитата: usilitel от ноября  7, 2021, 14:05То есть мне нужно написать программу, которая автоматически будет подгонять субтитры друг к другу, без участия человека.
То есть искусственный интеллект?
Пиши, что думаешь, но думай, что пишешь.
MONEŌ ERGŌ MANEŌ.
Waheeba dokin ʔebi naha.
«каждый пост в интернете имеет коэффициент бреда» © Невский чукчо

Red Khan

Цитата: usilitel от ноября  7, 2021, 14:05
Да, по-отдельности они плюс-минус нормально ложатся на видео.
Просто интересно, а что вы тогда хотите в результате получить?

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр