[d | an-b-bro-fr-gf-hr-l-m-maid-med-mi-mu-ne-o-old_o-p-ph-r-s-sci-sp-t-tran-tv-w-x | bg-vg | au-mo-tr | a-aa-abe-azu-c-dn-fi-hau-jp-ls-ma-me-rm-sos-tan-to-vn | misc-tenma-vndev | dev-stat]
[Burichan] [Futaba] [Gurochan] [Tomorrow] [Архив-Каталог-RSS] [Главная]

Файл: sv-b.jpg -(559 KB, 1055x1200, sv-b.jpg)
559 No.13558  

Просто оставлю здесь.
fl-talks@conference.jabber.ru - конфа для общение на тему иностранных языков.
пикрандом

>> No.14098  
Файл: 12718639860175991.jpg -(128 KB, 640x480, 12718639860175991.jpg)
128

бапм
пикча намекает что скоро будет лето и то чем социошкольники будут делать

>> No.14099  

>>14098
Чем социошкольники будут делать что?

>> No.14110  

>>14099
Новых социошкольников.

>> No.14114  

>>14110
КаЯгуаром?

>> No.14135  

>>14114
Ну не непосредственно им самим, но, говорят, способствует.

>> No.14140  

И все же надо было цвет баночек поблекше сделать, а то даже мои любимые кислотные порномультики смотрятся по сравнению с ними как туманный Лондон.

>> No.14145  

>>14140
Это потому, что реальность блекла и лишь яга привносит в неё новые краски.

>> No.14146  

>>14145

>кислотные порномультики
>реальность

Горжусь Ичаном!

>> No.15149  
Файл: indoeur1.jpg -(148 KB, 1062x678, indoeur1.jpg)
148

bamp

>> No.15152  

>>15149
bʌmp?

>> No.16461  
Файл: r2311123.jpg -(413 KB, 1350x1044, r2311123.jpg)
413

Не буду создавать тред, может кому нужно будет словарь Yarxi в формате EPWING
http://code.google.com/p/yarxi-epwing/

пикрандом

>> No.16658  

>>16461
А есть ли словарь Yarxi в формате EDICT?

>> No.16659  

Хотя нет, не едикт, мне бы в тхт без тегов в формате иероглиф + оны + дзюкуго, разбитые на группы по значению (ну как обычная статья яркси).

>> No.16662  
Файл: rika.jpeg -(6 KB, 251x201, rika.jpeg)
6

А я задумал написать читалку под андроида, которая подписывает фуригану. Но теперь в большом затруднении - какие же форматы она должна поддерживать? Хотелось бы читать ранобе, но оно же в сканах? В общем, помогите.

>> No.16665  

>>16662
Aozora txt, если вообще делать. Бтв, зайди в конфочку, я буду следить за твоим проектом.

>> No.16669  

>>16665
ОК, буду делать. В конфочки не могу - стесняюсь. Да и от той проги много ожидать не стоит - из меня тот ещё быдлокодер. Когда будет что показать - создам тред.

>> No.16670  

Скажите, зачем в читалках подписывать фуригану? Если ты знаешь перевод слова, то ты должен знать и как оно читается. Если перевода не знаешь, то его чтение всё равно будет бесполезно (всё равно придется заглядывать в словарь, а там заодно и чтение узнаешь). Т.о. Надо либо фуригану вместе с переводом подписывать, что невозможно, ибо перевод слишком длинный, либо вообще ничего не подписывать.

>> No.16671  

>>16670
Какой перевод? Японские книги рассчитаны прежде всего на японцев (как и книги любого другого народа на их родном языке). Ну а у них фактически два повода писать фуригану:
1) Можно не знать написания слова кандзями, но само слово знать.
2) Если слово неизвестно, то в толковом словаре поиск по произношению.

Это по поводу существующих читалок. Зачем фуригана >>16662-куну - лучше узнать у него самого.

>> No.16672  

>>16670
По фуригане куда как проще искать в словаре, если уж на то пошло. К тому же иногда бывает(у меня), когда примерно смысл слова ясен, а в чтении не уверен. К тому же сделаю так, что при нажатии на слово во всплывающем окне будет появляться перевод - по-моему, такое вполне имеет смысл.

>> No.16676  

>>16672

>иногда бывает(у меня)

У меня тоже бывает, но в том и суть, что иногда. Зачем текст, переполненный фуриганой, если 95% этого текста ты читаешь без проблем? Лучше было бы и чтение только в окошке перевода показывать, а фуригана только в глазах рябить будет.
>>16671
Я не о японцах, я о >>16662-куне и о кунах с их фуриганными читалками в соседнем треде.

>> No.16677  

>>16672
На самом деле лучше прикрутить нормальный поиск по epwing словарям тогда. Если бы хотя бы одна из японских читалок была опенсурсной, я бы может поприкручивал. Сейчас я пользуюсь Vertical Text Viewer https://market.android.com/details?id=org.example.android.npn2SC1815J.VerticalTextViewer
Она умеет искать, генерируя интеншн на поиск или запуская браузер с указанным урлом. Алгоритм для выделения слов тоже простой: берутся только кандзи под пальцем.
Это дело по идее можно улучшить.
(Я пользуюсь епвинг словарём)

>> No.16679  

>>16677
Собственно поэтому я и предлагал куну зайти в конфочку. Мы там не кусаемся, а идеями и опытом в разном помочь можем.

>> No.16683  
Файл: tree.jpg -(361 KB, 640x479, tree.jpg)
361

>>16662

>А я задумал написать читалку под андроида, которая подписывает фуригану.

Правильно заметили здесь, есть aozora, от нее и лучше отталкиваться, так как много книг там есть уже с фуриганой конечно она редкая там ибо для них все делалось, да и возможно читать пдф на ведроиде не очень легко, я хз. Можешь взять и mecab-ом отранслировать текст, например. Как, могу поделиться, сам писал для себя на перле такое, заходи как-нибудь.

>> No.16687  

>>16683
Кроме того, что много книг находится на самой аозоре, ещё много книг японцы выкладывают в aozora-txt формате в сеть (pd). Как OCR, правда.

>> No.16725  

В общем, читалка пишется, хоть и медленно.
Пока что для фуриганы использую базовый EDICT - так что подписывается весь корень слова целиком, а не отдельные иероглифы.
Большая часть времени тратится на разборки с джавой (это моя первая на ней программа:3)

>> No.16728  

>>16725
Ссылку на проект в студию.

>> No.16734  

>>16725
можно и словарем как edict и делать как в рикайчан, но думаю подключать mecab легче

>> No.16736  

>>16734
Mecab - это 100мб
Ты точно хочешь читалку весом в 100мб?

>> No.16737  

Где ты увидел эти 100 мегабайт? На нолик не ошибся?
11 мегов скомпилированная версия со словарями под винду.

>> No.16738  

>>16734
А как пользоваться mecab-ом на андроиде - есть ли С\C++-ный исходник? Перла андроид не понимает вроде как.
Пока да, сделано как в рикайчане.
>>16728
Так ведь не готово же. То есть фуригану-то оно подписывает, но вот возня с форматированием текста, все эти разбивки по страницам - просто кошмар какой-то. К тому же пытался начать пользоваться SmartSVN 6.6, но как-то не вышло. Могу разве что архивом на какой ргхост потом скинуть, когда будет что показать.

>> No.16741  
Файл: 2011-11-11-110946_1082x529_scrot.png -(86 KB, 1082x529, 2011-11-11-110946_1082x529_scrot.png)
86

>>16738
Ты уверен что там перл? Перл для тестов генерации баз.

Есть там и пример как использовать (example.c[pp]) и описание что и как в libmecab.html (на японском правда)

>> No.16747  

>>16737
Скомпилированная главная матрица MeCab весит ровно 100МБ.

>>16738
МeCab то как раз на плюсах, к тому же там есть SWIG-модуль, из которого можно быстро сделать интерфейс к жабе, останется потом только скомпилить и возможно немного его подправить, поскольку MeCab внутри использует не юникод.

>> No.16748  

>>16738
Пользуйся git + github
Лучшее, что есть

>> No.16750  

>>16748 база в какой кодировке? если utf-8 тогда больше на 30% будет нежели от euc-jp

>> No.17217  

>>13558
Если на борде появилась популяция новых людей в связи с норёку, заходите в гости.

>> No.18684  
Файл: trinity.gif -(16 KB, 468x302, trinity.gif)
16

мы здесь

>> No.20804  

Должен сказать что мекаб всегда просасывает, словарик плохой.

散茶女郎(さんちゃじょろう)

散    動詞,自立,*,*,五段・ラ行,体言接続特殊2,散る,チ,チ
茶 名詞,一般,*,*,*,*,茶,チャ,チャ
女郎 名詞,一般,*,*,*,*,女郎,ジョロウ,ジョロー
>> No.20805  

>>20804
Это фича, очень полезная.

>> No.20806  

>>20804

> 散茶女郎(さんちゃじょろう)

散 動詞-自立 散る 体言接続特殊2 チ チ
茶 名詞-固有名詞-地域-一般 * * チャ チャ
女郎 名詞-一般 * * ジョロウ ジョロー
Mecab
散 動詞,自立,,,五段・ラ行,体言接続特殊2,散る,チ,チ,ち/散, ちる 散る
茶 名詞,一般,,,,,茶,チャ,チャ,,,茶 - 茶
女郎 名詞,一般,,,,,女郎,ジョロウ,ジョロー,,,女郎/女臈 - 女郎
Juman
散 散 散 未定義語 NIL
茶 ちゃ 茶 名詞 代表表記:茶/ちゃ 漢字読み:音 カテゴリ:人工物-食べ物 ドメイン:料理・食事
女郎 女郎 女郎 名詞 自動獲得:Wikipedia 読み不明 Wikipediaリダイレクト:遊女

В мекаб легко добавлять слова же.

>> No.22210  

>>13558
Раз просят конфочку для японского --- бамп, ибо такая уже есть.




[d | an-b-bro-fr-gf-hr-l-m-maid-med-mi-mu-ne-o-old_o-p-ph-r-s-sci-sp-t-tran-tv-w-x | bg-vg | au-mo-tr | a-aa-abe-azu-c-dn-fi-hau-jp-ls-ma-me-rm-sos-tan-to-vn | misc-tenma-vndev | dev-stat]
[Burichan] [Futaba] [Gurochan] [Tomorrow] [Архив-Каталог-RSS] [Главная]