Наиболее эффективный язык для общения с ИИ
Нет, не английский, как ни странно. И не испанский. А польский!
Ну да, "я и сама офигела".
Исследование, проведенное Университетом Мэриленда (UMD) и Microsoft, показало, что из 26 различных языков польский оказался самым эффективным для управления моделями искусственного интеллекта (ИИ), а английский занял только шестое место.
«Наш эксперимент дал несколько неожиданных и неинтуитивных результатов. Во-первых, английский язык не показал лучших результатов во всех моделях, фактически заняв шестое место из 26 языков при оценке длинных текстов, в то время как польский язык оказался лидирующим», — пишут авторы отчета.
Группа исследователей проверила, насколько хорошо несколько основных языковых моделей ИИ, включая OpenAI, Google Gemini, Qwen, Llama и DeepSeek, реагировали на одинаковые вводные данные на 26 различных языках.
Результаты показали, что польский язык продемонстрировал среднюю точность выполнения задач на уровне 88%.
«Как показывает анализ, он является самым точным с точки зрения подачи команд искусственному интеллекту. До сих пор польский язык широко считался одним из самых сложных для изучения. Как оказалось, люди испытывают с ним трудности, но не ИИ», — написало Польское патентное ведомство в посте на Facebook.
Интересно, что системы искусственного интеллекта продемонстрировали хорошее понимание польского языка, несмотря на то, что объем данных на польском языке, доступных для обучения, намного меньше, чем на английском или китайском.
Для сравнения, китайский язык показал заметно худшие результаты, заняв четвертое место с конца из 26 протестированных языков.
В топ-10 наиболее эффективных языков для разговорного ИИ вошли:
- Польский 88%
- Французский 87%
- Итальянский 86%
- Испанский 85%
- Русский 84%
- Английский 83,9%
- Украинский 83,5%
- Португальский 82%
- Немецкий 81%
- Нидерландский 80%
(Отсюда.)
m.youtube.com
Но есть деление на мужской род, женский род и никакой.
Есть множественное число и единственное число.
И концувки слов зависят от того в каком числе, в каком множестве и в каком времени данное слово используется. Плюс нет определённого порядка слов и как в русском языке слова могут бегать туда сюда, склонять się по падежам.
Вот это вот się, которое аналог русского ться/ся вапще отдельная хрена которая вполне может стоять перед глаголов, а не после, как мы привыкли (у чехов в этом плане больше порядка, там оно стоит в определённом месте).
Плюс носовые ą ę, которые непривычны, да ещё и в разных местах звучат по-разному.
Плюс ложные друзья переводчика.
Стандартный пример: ruchać się, что в переводе с украинского- двигаться, а в польском заниматься сексом.
Если бы только на польском общаться, то может бы мозг и перестроился окончательно, но постоянное общение на украинском и русском вносят хаос и не разбериху.
Как шутил один шутник: купил польско-украинский словарь и выучил польско-украинский язык.
Если просто общаться - не сложно, за год/полтора можно уже спокойно трещать как не в себя, и выучить уровень В1
m.youtube.com
Gemini: Я все сделал правильно?
Я: Все отлично, только "м" должна быть заглавной, поменяй.
Gemini: Да, я вижу, моя ошибка, как теперь?
Я: "м" должна быть заглавной, поменяй.
Gemini: Прошу прощения, ошибка, сейчас поменяю. Как теперь?
Я: Замени слово "GRim" на "GRiM".
Gemini: Я опять ошибся, сейчас поменяю Как теперь?
Я: Ты не сделал что я просил, замени слово "GRim" на "GRiM".
.....
Так продолжалось еще раз 5, так и не поменял. Наверное надо было попробовать по-польски 😄
Бывает что его циклит и он выдает одно и тоже, рассказывая как классно он все поменял
Я думаю что у польского языка не очень много флейма и не такой огромный корпус использовался в обучении, поэтому выхлоп имеет высокий КПД.
Я полагаю, что если бы накопили хороший корпус какого-нибудь эсперанто, то ввиду отсутствия исторического мусора и флейма КПД был бы ещё выше. Кстати что-то его роднит с польским, да?
И жаль, что в списке нет азиатских языков.
"Я думаю, чтоеёплатье красивое ичтооно идёт ей" .
Про арабский не знаю. Ещё не учила ))))
Или согласные.
Или согласные.
В этом фильме отсутствие оригинальной озвучки и нативных выражений и шуток убивает примерно девяносто девять процентов содержания!
И речь не о простом мате! Это нечто совершенно особое, отсутствующее в любом другом языке.
К тому же слово ,,курва,, часто используется просто как пробел между словами, равно как и в русском бл...ь
Курва - нечто кривое и такие женщины за неимением других возможностей заработка, зарабатывали как могли. Так и пошла в народ ,,курва,,.
Есть такой вариант происхождения.
А угадайте, как в Польше, в послевоенное время называно женщин, которые делали тоже самое, прячась от глаз подальше в развалинах
И речь не о простом мате! Это нечто совершенно особое, отсутствующее в любом другом языке.
- Английский 83,9%
Кто бы сомневался. Блатную феню в качестве JCL не рассматривали?
ШІ таки гарна річ.
Может ли быть, что раз данных было меньше, то они просто более качественные, там меньше "шума" и соответственно меньше вероятность, что LLM при статистическом анализе следующего слова будет ориентироваться на что-то, что свернет его вообще не в ту сторону?
Возможно и играет какую-то роль, но обучается-то ии на огромном множестве текстов и вроде как должен понимать, о чем идет речь, независимо от языка.
Кстати, об ИИ!
Польскоязычные ролики, созданные ИИ, где главный герой - Бобр. И его приятели.
Искать на ютубе bóbr kurwa
"Fuck, look what I met,
A beaver, fuck!
What a fucking beast
Beaver
Hey, fucking beaver
Beaver, don't fuck off, you bastard
Fuck come to me, beaver
But you're fucking big!
Beaver, fuck, it's the first time in my life I've seen a beaver!
What a fucking bastard, he fell into the water and drowned!
Hey beaver, hello beaver, AAA
You dickhead beaver
Shed! What a cool beaver...
Aaa-aa-aa, fuck it bites!”
Много радостных эмоций.
Там есть целая подборка: поляки встречают разных животных.
(Бобр, еж, пингвин etc.)
- Сегодня будет зарплата!
- Это не может не радовать...
Апдейт: Дошло ))
----------------------------------
Во время лекции оксфордский философ-лингвист Дж. Л. Остин заявил, что, хотя двойное отрицание в английском языке подразумевает утвердительное значение, нет ни одного языка, в котором двойное утверждение подразумевало бы отрицание. На что Сидней Моргенбессер ответил пренебрежительным тоном: "Да, конечно".
Wtedy szynka będzie lepsza!
И так и нашли потом по фото откуда шёл слив.
Мы на работе одно время использовали подобное ПО, потом отказались. Потому, что работать над текстом обычным пользователям становится очень трудно. Для профилактики внутренних утечек — накладно, а для выявления — заметно.
Slavic languages (Russian, Ukrainian, Polish) perform highly, surpassing the performance of Romance languages like Italian, French, and Spanish. English performance is even lower, typically 8th.
-------------------------------------
Славянские языки (русский, украинский, польский) демонстрируют высокую производительность, превосходящую производительность романских языков, таких как итальянский, французский и испанский. Производительность английского языка еще ниже, как правило, 8-е место.
Да и сейчас уже как правило ии не «игнорирует 12% ячеек», а в 12% случаев делает не то, что надо. А в остальных случаях - именно на 100% то.
Да и Экселю (таблицам) эффективность ии и не снилась.
Ну ОК, в 12% вместо возведения в квадрат квадратный корень извлек.
Как проверить? Попросить тестов написать, очевидно.
Я однажды попросил выдать таблицу распространённых растительных масел с содержанием омега3 и омега6.
Всё было вроде правильно, но для подсолнечного масла значения были перепутаны. При этом в колонке соотношения омега3/омега6 стояло правильное значение.
Шахматку.
И простой карандаш.
BTW, геномы человека и собаки одинаковы примерно на 88%. "Hеплохо, неплохо"
// this should be eventually replaced
// with a real test for this cool feature
}
Подобные тесты AI любит генерировать тоннами. И они, конечно же, успешно проходят.
