Author Topic: Тексты на транслитерации для тестирования программы  (Read 2966 times)

0 Members and 1 Guest are viewing this topic.

Offline 4ydnaya

  • Newbie
  • Posts: 4
  • Gender: Female
Всем привет!

Очень нужна ваша помощь!
Мне для дипломной работы необходимо найти тексты на языках, основанных на кириллическом алфавите, которые написаны на транслитерации. Поисковики не дают адекватных результатов. Подскажите, пожалуйста, где их можно найти.

Всем заранее спасибо!

Offline Rwseg

  • Posts: 7039
  • Gender: Male
  • Русег
Берём любой текст из сети, вставляем его в окошко слева, получаем справа результат.
http://www.lexilogos.com/clavier/russe_conversion.htm

Я попробовал текст в 3 Мб, всё получилось.

Offline vfaronov

  • Posts: 214
  • Gender: Male
Если Вам нужны образцы стихийного транслита, просто придумывайте фразы от балды и ищите в гугле транслитерацию — вылезают, как минимум, небольшие фрагменты.

Попробуйте (в кавычках):
"ya uzhe ustal povtoryat"
"za4em voobshe eto"
"v sleduusij raz"

Offline 4ydnaya

  • Newbie
  • Posts: 4
  • Gender: Female
Спасибо большое за ответ!

Подскажите, пожалуйста, а на этом сайте http://www.lexilogos.com/clavier/russe_conversion.htm можно самим составлять таблицу транслитерации?

Offline Iskandar

  • Posts: 33060
Скачать страницу на комп, поправить код вручную и пользоваться
čiyōn paydāg kū: “brihēnēd ōy ī wisp-āgāh dādār az harw mārīg-ē sraw-ē”
Ибо известно: “Всеведущий Творец из каждого слова производит (целую) речь”

Offline 4ydnaya

  • Newbie
  • Posts: 4
  • Gender: Female
А если я программировать не умею?)

Offline Rwseg

  • Posts: 7039
  • Gender: Male
  • Русег
Берёте сохраняете страницу на свой диск.
http://www.lexilogos.com/keyboard/russian_conversion.htm
Потом открываете папку russian_conversion_files, которая находится там же, куда вы сохранили страницу,
Внутри этой папки находите файл conru, открываете его в Блокноте (ПК мыши>Открыть с помощью>Выбрать программу> Блокнот>ОК).

В блокноте заменяете в строках буквы. Например, находите

car = car.replace(/ж/g, "ž");

меняете букву ž на zh, получаете

car = car.replace(/ж/g, "zh");

Теперь у вас «ж» транслитерируется не в ž, а в zh.
Делаете с остальными по вкусу. Сохраняете файл (Файл>Сохранить). Теперь открываете сохранённую веб-страницу <ваш диск>:\<ваша папка>\russian_conversion.htm

Теперь транслитерация будет проходить согласно вашей схеме.

P.S. Советую вам скачать и использовать Notepad++ http://notepad-plus-plus.org/download/ вместо стандартного Блокнота.

А если я программировать не умею?)
Скажите, в каком таком вузе дипломник-программист не умеет программировать? Вот интересно просто.

Offline 4ydnaya

  • Newbie
  • Posts: 4
  • Gender: Female
Спасибо за помощь!

А если я программировать не умею?)
Скажите, в каком таком вузе дипломник-программист не умеет программировать? Вот интересно просто.

Я не писала и не могла написать, что я - программист-дипломник, потому что им не являюсь. Я не стала вдаваться в подробности моей дипломной работы, так как меня интересовал конкретный ответ на вопрос : "где найти тексты на траслитерации?"


Offline Rwseg

  • Posts: 7039
  • Gender: Male
  • Русег
Я не писала и не могла написать, что я - программист-дипломник, потому что им не являюсь.
Понятно, я было подумал вы себе диплом пишите.

Я не стала вдаваться в подробности моей дипломной работы, так как меня интересовал конкретный ответ на вопрос : "где найти тексты на траслитерации?"
А что за тема дипломной и в чём её суть? Интересно, зачем там такие тексты.

Offline beaver

  • Posts: 57
  • Gender: Male
Будьте очень осторожны с таким подходом!!!

Проблема с таким: "Берём любой текст из сети, вставляем его в окошко слева, получаем справа результат", в том, что мы получим результаты только из этого транслитератора! А не репрезентативную выборку! То есть на текстах из одного транслитератора не будут выполняться те же закономерности, что и в реальных текстах, написанных людьми!

Обьясню, почему так... В реальных текстах буква ж может передаваться zh, j, g, }|{, ž, ż, ź... В транслитераторе оно всегда будет передаваться одним образом!

Поэтому, генерируя тексты автоматически надо быть осторожным!

Конечно, всё зависит от цели... Если цель - проверить работу транслитератора из латиницы в кириллицу, то тексты Rswegа не подойдут!!! Ведь вы проверите, как транслитерируется слово "zhaba", но не проверите, как программа обработает варианты "jaba", "geaba", "}|{aba", "żaba" и т.д.! То есть вы проверите далеко не всё!
Вы можете купить шубу в натуральном цвете, который варьируется от черного до темно-коричневого, от палевого до золотистого. А, возможно, вы предпочтете шубку в цветном варианте: жемчужном, кофейном, сером или даже красном или ярко-синем. На каком бы фасоне и оттенке вы не остановились, можете не сомневаться: бобёр – отличный выбор.

Offline Rwseg

  • Posts: 7039
  • Gender: Male
  • Русег
Конечно, всё зависит от цели
Вот, мы ведь не знаем, зачем автору понадобились такие тексты.

В реальных текстах буква ж может передаваться zh, j, g, }|{, ž, ż, ź...
Эх, где бы такие массовые и разнообразные корпусы ещё найти...

Ведь вы проверите, как транслитерируется слово "zhaba", но не проверите, как программа обработает варианты "jaba", "geaba", "}|{aba", "żaba" и т.д.!
Можно сделать несколько разных скриптов/программ для разных вариантов.

Offline Demetrius

  • Posts: 12392
  • Бес джинн фея колдунчик
Эх, где бы такие массовые и разнообразные корпусы ещё найти...
Василий Фаронов же уже предложил хороший способ его составлять:
Если Вам нужны образцы стихийного транслита, просто придумывайте фразы от балды и ищите в гугле транслитерацию — вылезают, как минимум, небольшие фрагменты.

Например, я попробовал, вот какая красота нашлась:
Quote
s dnyxoi teb9l )l(elau vsego nailydLLlego lybvi s4astb9l i vsego togo 4to tbl po)l(elaeLLl p.s otkrbltky nemagy otpravitb potamy 4to v estonii v internet cofe a tyt...
Quote
S DNUXOJ TEBYA!*ELAU VSEGO SAAAAAAAAAMOGO KRUTOGO!!!!Vsego 4ego ti sama xo4ew i da*e bolwe!!!!!*elau
Spoiler: осторожно, мат! (спойлер мой — Dēme) ⇓⇓⇓
otmetit eto delo!
«Честного не жди слова, // Я тебя предам снова»

Offline beaver

  • Posts: 57
  • Gender: Male
Я не видел готовых корпусов на транслите. :( Только если самому составлять.
Вы можете купить шубу в натуральном цвете, который варьируется от черного до темно-коричневого, от палевого до золотистого. А, возможно, вы предпочтете шубку в цветном варианте: жемчужном, кофейном, сером или даже красном или ярко-синем. На каком бы фасоне и оттенке вы не остановились, можете не сомневаться: бобёр – отличный выбор.

 

With Quick-Reply you can write a post when viewing a topic without loading a new page. You can still use bulletin board code and smileys as you would in a normal post.

Note: this post will not display until it's been approved by a moderator.
Name: Email:
Verification:
Type the letters shown in the picture
Listen to the letters / Request another image
Type the letters shown in the picture:
√49 Напишите ответ строчными буквами:
«Сто одёжек, все без застёжек» — что это?: