Главное меню
Мы солидарны с Украиной. Узнайте здесь, как можно поддержать Украину.

Здесь есть программисты?

Автор RawonaM, августа 15, 2007, 11:20

0 Пользователи и 1 гость просматривают эту тему.

RawonaM

Предлагаю разрабатывать вместе какой-нибудь лингвистический софт (можно Open Source), чтобы было полезно и в использовании и в практике программирования.
Также жду идей от всех форумчан, какую программу хотелось бы иметь в своем распоряжении.

Если не найдется хорошая идея, то можно написать свой скрипт форума. 8)

shravan

Очень хотелось бы иметь текстовый редактор для Pocket PC, с поддержкой юникода.
ܐܝܠ ܐܝܠ ܠܡܢܐ ܫܒܩܬܢܝ

RawonaM

Цитата: "shravan" от
Очень хотелось бы иметь текстовый редактор для Pocket PC, с поддержкой юникода.
А чем Word плох?

shravan

ܐܝܠ ܐܝܠ ܠܡܢܐ ܫܒܩܬܢܝ

Pere

Если будете что-то на Python делать, мог бы поучаствовать в какой-то степени (особенно, если в случае веба - Django, в случае GUI - wxPython). За последний десяток лет тяжеловесы вроде C++, Java, C# порядком утомили велеречивостью конструкций.
Поглянь на дім свій, Янголе ©

Lei Ming Xia (reloaded)

предлагаю сделать транслит/online клавиатуру для всех языков  :)
несколько тысяч языков исчезнет уже в XXI столетии :(

>>> нас объединяет любовь к языкам <<<

Karakurt

Как насчет программы распознавания текста из отсканенного материала? Например, имеется словарь в pdf. Надо создать базу данных. С возможностью добавлять символы для других языков. Я сам программировал когда-то на C++/Java.

ou77

Ага, точно, хотя бы шрифты под файнридер сделать которые можно легко под текст подгонять, чтобы распознавало легко...

Wolliger Mensch

Цитата: ou77 от августа 16, 2007, 09:20
Ага, точно, хотя бы шрифты под файнридер сделать которые можно легко под текст подгонять, чтобы распознавало легко...

Я думаю, куда насущнее сделать файнридер, чтобы распознавал уже существующие книги.
«Вот интересно, каких лингвистических жемчуг можно найти в море отодвинутых книг», Ян Гавлиш.
«Впредь прошу помнить, что придумал игру не для любых ассоциаций, а для семантически оправданных. Например, чтó это такое: ,,рулетке" — ,,выпечке"?? Тем более, что сей ляпсус я сам совершил...», Марбол
«Ветхий Завет написан на иврите и частично на армейском», Vesle Anne
«МЛ(ять)КО ... ПЛ(ять)NЪ», Тася
«Вот откроет этот спойлер, например, Марго, ничего не подозревая, а потом будут по всему форуму блюющие смайлики...», Авал
«Томан приличный мужчина. Правда по патриархальным меркам слегка голодранец», Vesle Anne
«Возможен ли фонетический переход "ж" в "п с придыханием"», forest

ou77

уже существующий файнридер вполне распознает, ему надо только языки догружать, вот их и надо написать...
Да только програмистов всёравно нету здесь, а если есть, то не станут писать, так что разговор ниочём.

Wolliger Mensch

Цитата: ou77 от августа 16, 2007, 10:32
уже существующий файнридер вполне распознает, ему надо только языки догружать, вот их и надо написать...
Да только програмистов всёравно нету здесь, а если есть, то не станут писать, так что разговор ниочём.
Существующий лингвистический тексты не распознает. Его можно обучать, но только распознавать отдельные символы, точно сопадающие с эталоном, — в отсканированных текстах пискелизация знаков может быть самая разнообразная, — быстрее вручную набрать.
«Вот интересно, каких лингвистических жемчуг можно найти в море отодвинутых книг», Ян Гавлиш.
«Впредь прошу помнить, что придумал игру не для любых ассоциаций, а для семантически оправданных. Например, чтó это такое: ,,рулетке" — ,,выпечке"?? Тем более, что сей ляпсус я сам совершил...», Марбол
«Ветхий Завет написан на иврите и частично на армейском», Vesle Anne
«МЛ(ять)КО ... ПЛ(ять)NЪ», Тася
«Вот откроет этот спойлер, например, Марго, ничего не подозревая, а потом будут по всему форуму блюющие смайлики...», Авал
«Томан приличный мужчина. Правда по патриархальным меркам слегка голодранец», Vesle Anne
«Возможен ли фонетический переход "ж" в "п с придыханием"», forest

ou77

я ему из юникода вставлял - понимал, например ять распознавал (хотя и не отображал его)

Wolliger Mensch

Цитата: ou77 от августа 16, 2007, 10:55
я ему из юникода вставлял - понимал, например ять распознавал (хотя и не отображал его)

Да, и с уникодом он не дружит.
«Вот интересно, каких лингвистических жемчуг можно найти в море отодвинутых книг», Ян Гавлиш.
«Впредь прошу помнить, что придумал игру не для любых ассоциаций, а для семантически оправданных. Например, чтó это такое: ,,рулетке" — ,,выпечке"?? Тем более, что сей ляпсус я сам совершил...», Марбол
«Ветхий Завет написан на иврите и частично на армейском», Vesle Anne
«МЛ(ять)КО ... ПЛ(ять)NЪ», Тася
«Вот откроет этот спойлер, например, Марго, ничего не подозревая, а потом будут по всему форуму блюющие смайлики...», Авал
«Томан приличный мужчина. Правда по патриархальным меркам слегка голодранец», Vesle Anne
«Возможен ли фонетический переход "ж" в "п с придыханием"», forest

ou77

он его распознаёт и отличает, и по-моему потом даже передает в ворд, только что не отображает - квадратики вместо...
(но в ворд возможно тоже в виде квадратиков передает)

Wolliger Mensch

Я не говорил, что не понимает, я сказал, что не дружит. Что, вообще очень странно для такой программы.
«Вот интересно, каких лингвистических жемчуг можно найти в море отодвинутых книг», Ян Гавлиш.
«Впредь прошу помнить, что придумал игру не для любых ассоциаций, а для семантически оправданных. Например, чтó это такое: ,,рулетке" — ,,выпечке"?? Тем более, что сей ляпсус я сам совершил...», Марбол
«Ветхий Завет написан на иврите и частично на армейском», Vesle Anne
«МЛ(ять)КО ... ПЛ(ять)NЪ», Тася
«Вот откроет этот спойлер, например, Марго, ничего не подозревая, а потом будут по всему форуму блюющие смайлики...», Авал
«Томан приличный мужчина. Правда по патриархальным меркам слегка голодранец», Vesle Anne
«Возможен ли фонетический переход "ж" в "п с придыханием"», forest

RawonaM

Цитата: "shravan" от
Нет таблицы символов.
Кстати, таблица символов есть в Экселе. А что вам нужно вводить через таблицу символов и как часто?


shravan

В Pocket PC нет возможности набирать (и читать) тексты на многих языках. Надо обязательно устанавливать поддержку для этих языков, а она есть далеко не для всех и съедает много места в памяти. Таблица символов, наподобие вордовской или SC Unipad позволила бы вводить символы других языков, ничего не меняя.
ܐܝܠ ܐܝܠ ܠܡܢܐ ܫܒܩܬܢܝ

RawonaM

Цитата: "shravan" от
В Pocket PC нет возможности набирать (и читать) тексты на многих языках. Надо обязательно устанавливать поддержку для этих языков, а она есть далеко не для всех и съедает много места в памяти.
Чтобы читать нужно установить подходящий шрифт, а чтобы вводить символы - ввод с клавиатуры. Или вы смогли бы через таблицу символов набрать арабский текст, к примеру?

Цитата: "shravan" от
Таблица символов, наподобие вордовской или SC Unipad позволила бы вводить символы других языков, ничего не меняя.
Экселовскую посмотрели? Menu->Insert->Symbol...
Ничего не меняя не получится, потому что шрифты, которые идут в стандартной поставке, содержат мало символов. Установите Arial Unicode и тогда можно будет видеть почти любые языки и вводить почти любые символы через эту функцию.

shravan

Для языков с обратным направлением письма (справа-налево) все равно придется специально устанавливать поддержку. Arial Unicode не поможет, т.к. направление набора текста останется прежним.
Экселевскую таблицу символов посмотрел. Это действительно неплохое подспорье, но почему бы не сделать возможным использование такой же таблицы в текстовом редакторе, а не только в Экселе? Согласитесь, не очень удобно набирать текст в Экселе, а потом копировать его в буфер и переносить в Ворд?
А вообще меня удивляет отсутствие интереса форумчан к обсуждаемой теме. Неужели никто кроме меня и вас не пользуется PDA? И неужели пользователей этих девайсов не коробит отсутствие в них возможности набирать тексты на разных языках?
ܐܝܠ ܐܝܠ ܠܡܢܐ ܫܒܩܬܢܝ

Wolliger Mensch

«Вот интересно, каких лингвистических жемчуг можно найти в море отодвинутых книг», Ян Гавлиш.
«Впредь прошу помнить, что придумал игру не для любых ассоциаций, а для семантически оправданных. Например, чтó это такое: ,,рулетке" — ,,выпечке"?? Тем более, что сей ляпсус я сам совершил...», Марбол
«Ветхий Завет написан на иврите и частично на армейском», Vesle Anne
«МЛ(ять)КО ... ПЛ(ять)NЪ», Тася
«Вот откроет этот спойлер, например, Марго, ничего не подозревая, а потом будут по всему форуму блюющие смайлики...», Авал
«Томан приличный мужчина. Правда по патриархальным меркам слегка голодранец», Vesle Anne
«Возможен ли фонетический переход "ж" в "п с придыханием"», forest

Darkstar

Цитата: RawonaM от августа 15, 2007, 11:20
Предлагаю разрабатывать вместе какой-нибудь лингвистический софт (можно Open Source), чтобы было полезно и в использовании и в практике программирования.
Также жду идей от всех форумчан, какую программу хотелось бы иметь в своем распоряжении.

Если не найдется хорошая идея, то можно написать свой скрипт форума. 8)


Человек!!! Ты просто читаешь мои мысли. Я сижу, думаю, где бы найти программиста для разработки программы по интерпретации сравнительно-исторических данных. (Сам учил в школе бейсик, потом еле-еле паскаль в вузе, но дальше этого не продвинулся...) А сейчас возникла ситуация, когда это понадобилось.
Суть: имеется таблица (матрица) слов в разных языках (html), записанных в фонетической форме. Программа берет каждый символ в каждом слове и посимвольно (пофонемно) сравнивает его с другим словом в другой ячейке по определенному (тщательно продуманному) алгоритму. В конце, программа подсчитывает степень фонемной близости разных слов и выводит среднее арифметическое для каждой пары языков и записывает их в диагональную матрицу сравнения. В результате можно автоматически подсчитать степень фонетической близости различных языков и выстроить древо вероятного генетического ветвления языков. Последние, кто делали что-то подобное публиковались в журнале Nature пару лет назад.
Если заинтересует и если получится, половина нобелевки твоя :-)


(1) С людями надо помягше, а на вопросы смотреть поширше (с) (2) Проекция (в психологии) - неосознанное приписывание собеседнику собственных мыслей и действий (3) Учебник логики еще никто не отменял (4) Какой был тезис?

Python

Насколько я понимаю, в подобных сравнениях приходится сопоставлять и слова, немного отличающиеся по смыслу? Напр., рус. «ло́шадь» и укр. «лоша́» (жеребенок). Есть сходство и по смыслу, и по внешнему виду, но точного соответствия нет. Если в процессе исследования приходится сравнивать подобные пары, это представляет особую сложность для автоматического поиска — компьютер ведь не понимает смысла слов, он просто сопоставляет теѯт слова и текст описания слова.
Пролетареві ніколи вчити європейських мов, бодай би свою знати добре і на ній принести до своєї хати світло знання (Гнат Хоткевич)
ÆC CASALI NAXI PRASQURI: AHOV CÆRU, MERTVÆRI TÆ SLAVUTÆT!
Вони просили його: «Скажи: кетум», а він говорив: «сатем», і не міг вимовити правильно.
Хотелось бы также отметить, что "Питон" - это "мышиный язык" : "пи+тон". © АБР-2

ou77

Цитата: Darkstar от августа 20, 2007, 14:07
Цитата: RawonaM от августа 15, 2007, 11:20
Предлагаю разрабатывать вместе какой-нибудь лингвистический софт (можно Open Source), чтобы было полезно и в использовании и в практике программирования.
Также жду идей от всех форумчан, какую программу хотелось бы иметь в своем распоряжении.

Если не найдется хорошая идея, то можно написать свой скрипт форума. 8)


Человек!!! Ты просто читаешь мои мысли. Я сижу, думаю, где бы найти программиста для разработки программы по интерпретации сравнительно-исторических данных. (Сам учил в школе бейсик, потом еле-еле паскаль в вузе, но дальше этого не продвинулся...) А сейчас возникла ситуация, когда это понадобилось.
Суть: имеется таблица (матрица) слов в разных языках (html), записанных в фонетической форме. Программа берет каждый символ в каждом слове и посимвольно (пофонемно) сравнивает его с другим словом в другой ячейке по определенному (тщательно продуманному) алгоритму. В конце, программа подсчитывает степень фонемной близости разных слов и выводит среднее арифметическое для каждой пары языков и записывает их в диагональную матрицу сравнения. В результате можно автоматически подсчитать степень фонетической близости различных языков и выстроить древо вероятного генетического ветвления языков. Последние, кто делали что-то подобное публиковались в журнале Nature пару лет назад.
Если заинтересует и если получится, половина нобелевки твоя :-)

Ну так список Сводеша давно существует (правда нобелевку он не получил, нет нобелевской премии по языкознанию)
Только правильно ли сопоставлять именно фонетическое звучание? Там даже точно родственные языки буду не совсем совпадать, а сравнятся быстрее субстаты, я тут предлагал где-то сделать такой "новый список Сводеша" - записать интернациональные слова в фонетической транскрипции и сравнить в разных языках, большее совпадение получим в языках с близким субстатом (Предположение строится на том, что мол фонетика меняется в последнюю очередь в случае ассимиляции)

Darkstar

Все это интересное обсуждение, но мне нужен программист :-) (Или хотя бы человек, который бы научил, посоветовал и т.д.)
(1) С людями надо помягше, а на вопросы смотреть поширше (с) (2) Проекция (в психологии) - неосознанное приписывание собеседнику собственных мыслей и действий (3) Учебник логики еще никто не отменял (4) Какой был тезис?

Darkstar

Есть у меня уже сокр. список Сводеша по 30 ИЕ группам, есть, я знаю, что делаю...
(1) С людями надо помягше, а на вопросы смотреть поширше (с) (2) Проекция (в психологии) - неосознанное приписывание собеседнику собственных мыслей и действий (3) Учебник логики еще никто не отменял (4) Какой был тезис?

Быстрый ответ

Обратите внимание: данное сообщение не будет отображаться, пока модератор не одобрит его.

Имя:
Имейл:
Проверка:
Оставьте это поле пустым:
Наберите символы, которые изображены на картинке
Прослушать / Запросить другое изображение

Наберите символы, которые изображены на картинке:

√36:
ALT+S — отправить
ALT+P — предварительный просмотр