Операция выполнена!
Закрыть
Хабы: Искусственный интеллект

TL:DR Это история, как я перевёл книгу с помощью DeepSeek

Краткая предыстория: я люблю читать книги. В последнее время предпочитаю достаточно специфический жанр литературы, который в обиходе называется «литРПГ». Проблема в том, что в русскоязычном сегменте качественных книг этого жанра довольно мало – в основном «прода» с Автор.Тудей, на фоне которой даже Донцова (было дело, я был молод и мне было совсем нечего читать) кажется отлитой в граните классикой. В англоязычном же сегменте довольно много качественных книг, но с переводами у них довольно туго – в основном ими занимаются энтузиасты, соответственно, качество переводов гуляет от «очень хорошо» до «гугл-транслейт», причём иногда в рамках буквально одной книги.

Собственно, сама история началась с моей попытки найти перевод книги «He who fights with monsters». Как оказалось, официального перевода не существует, а неофициальный... думаю, лучшей его характеристикой будет «почти читаемо». Примерно как еда в посредственной забегаловке: голод утолить можно, но потом не жалуйтесь на изжогу, бурчание в животе и позывы срочно посетить санузел. Прочитав несколько глав, и поняв, что удовольствия от такого чтения не получить, я начал думать, что же делать дальше. С нейросетями до этого мне сталкиваться практически не доводилось, несколько попыток сгенерировать картинку с антропоморфными зубными щётками в «Кандинском» - не в счёт. Для эксперимента я попробовал сходу зарядить в ДипСик пару глав книги – на удивление, получилось весьма неплохо. Заметно лучше, чем тот перевод, что я нашёл в интернете. Проблема была только в том, что в переведённом фрагменте отсутствовала примерно треть текста. Как выяснилось, если кидать на перевод сразу десяток страниц, ДипСик начинает филонить и переводит не всё. Причём делает это довольно незаметно – я это заметил только когда решил посмотреть, как перевёлся один кусок, который был особо коряво переведён в неофициальном переводе. Выяснилось, что никак – этого абзаца в переводе не было вообще. Пришлось отказаться от тактики перевода крупных кусков. Методом проб и ошибок было выяснено, что оптимальный размер одного куска текста – в районе 300-500 слов (~3/4 страницы формата А4). Меньше – получается сильно медленнее, больше – начинаются пропуски текста и...

Читать далее
Читайте также
СТАТЬ АВТОРОМ
НОВОСТИ

ПИШИТЕ

Техническая поддержка проекта ВсеТут

info@vsetut.pro