Как человек, который когда-то работал плотно с фотопереводом (правда со стороны OCR), могу заявить, что контекст очень как решает. Со стороны OCR чуть ошибёшься в разбивке предложений или абзацев — и перевод едет знатно.
Тут ребята написали пост про то, как они улучшали документный перевод путём дотюнивания YandexGPT. Тут вам и про задачу (почему надо так), и про peft, и про alignment. Рассказывают про то, чем им не угодил DPO.
Как итог: качество стало заметно выше, раскатывают модельку на приложения компании, а также в каком-то бенче в en->ru переводе заняли первое место, обогнав другие модельки (приятненько). Но есть куда расти (на другие языки, например).
Как человек, который когда-то работал плотно с фотопереводом (правда со стороны OCR), могу заявить, что контекст очень как решает. Со стороны OCR чуть ошибёшься в разбивке предложений или абзацев — и перевод едет знатно.
Тут ребята написали пост про то, как они улучшали документный перевод путём дотюнивания YandexGPT. Тут вам и про задачу (почему надо так), и про peft, и про alignment. Рассказывают про то, чем им не угодил DPO.
Как итог: качество стало заметно выше, раскатывают модельку на приложения компании, а также в каком-то бенче в en->ru переводе заняли первое место, обогнав другие модельки (приятненько). Но есть куда расти (на другие языки, например).
"He has kind of an old-school cyber-libertarian world view where technology is there to set you free," Maréchal said. "We as Ukrainians believe that the truth is on our side, whether it's truth that you're proclaiming about the war and everything else, why would you want to hide it?," he said. "Someone posing as a Ukrainian citizen just joins the chat and starts spreading misinformation, or gathers data, like the location of shelters," Tsekhanovska said, noting how false messages have urged Ukrainians to turn off their phones at a specific time of night, citing cybersafety. The Security Service of Ukraine said in a tweet that it was able to effectively target Russian convoys near Kyiv because of messages sent to an official Telegram bot account called "STOP Russian War." The next bit isn’t clear, but Durov reportedly claimed that his resignation, dated March 21st, was an April Fools’ prank. TechCrunch implies that it was a matter of principle, but it’s hard to be clear on the wheres, whos and whys. Similarly, on April 17th, the Moscow Times quoted Durov as saying that he quit the company after being pressured to reveal account details about Ukrainians protesting the then-president Viktor Yanukovych.
from br