Как и где заработать деньги студенту: как студент заработал больше миллиона рублей

Как я начал зарабатывать деньги. Комментарии

Это кардинально меняет расклад сил всего рынка стартапов машинного обучения и позволяет небольшим компаниям конкурировать с гигантами в заработок в интернете на инвестировании работы с большими данными. Я начал искать информацию о статистике DeepL. У Google за год было миллионов пользователей ежемесячно. У DeepL — 50 миллионов статья от 12 декабря Я задумался.

Если DeepL командой в 20 человек победил Google, имея в году машину в 5 petaFlops, а сейчас можно дешево арендовать машину в 2 petaFlops и купить качественные датасеты, насколько будет сложно добиться качества Google? Lingvanex Control Panel Чтобы быстро разбираться с задачами перевода и не запускать тесты из консоли, был сделан Dashboard, который позволял делать все задачи, начиная от подготовки и фильтрации данных до деплоя тестов перевода на Production.

На картинке ниже: cправа — список задач и GPU-серверов, на которых идет тренировка моделей. По центру — параметры нейронной сети, а снизу — датасеты, которые пойдут на тренировку. Работа над новым языком начиналась с подготовки датасета.

Мы брали их из открытых источников типа Wikipedia, заседания Европарламента, Paracrawl, Tatoeba и др. Чтобы получить среднее качество перевода, достаточно 5 миллионов переведенных строк. Датасеты представляют собой строки текста, переведенного c одного языка.

Потом токенизатор разделяет текст на токены и создает из них словари, отсортированные по частоте встречания токена.

Я студент и заработал больше миллиона рублей

Токеном могут быть как единичные символы, слоги, так и целые слова. После того как загрузили датасеты в БД, в них оказалось очень много слов с ошибками или с некачественным переводом.

Чтобы добиться хорошего качества, их нужно сильно фильтровать. Также можно купить уже качественные отфильтрованные датасеты.

До года я зарабатывал в интернете с помощью файлообменников, делал сайты.

Когда язык развернут на API, нужно установить для него список доступных функций распознавание голоса, синтез речи, распознавание картинки, парсер файла, сайта и др. Для работы функций используется стороннее API часть opensource — часть third-parties.

Буквально на днях был ровно год, как я уволился с работы, пообещав себе, что отныне в моей жизни не будет работодателей. Мной была поставлена четкая цель: за год с полного нуля сформировать стабильный источник дохода в интернете минимум в 3 раза больше моей зарплаты на последнем месте работы.

Потом это все разворачивается на API. Со временем был добавлен кеш. Продолжаем работу Весь год я потратил на решение проблемы качественного перевода на основных европейских языках.

Думал, что ещё полгода — и всё получится. Я был очень ограничен в ресурсах, задачами по Data Science занималось всего 2 человека.

Нужно было двигаться. Казалось, что решение проблемы в чем-то простом. Но светлый момент всё не наступал, я не был доволен качеством перевода. Запуская этот проект в одиночку и без инвестиций, я понял, сколько управленческих ошибок совершил. Но решение принято — идти до конца! Все бросились тренировать нейронные сети на базе этой Трансформер-модели и стали переходить на Python Tensorflow вместо старой Lua Torch Я решил тоже попробовать.

Также мы взяли новый токенизатор, сделали препоцессинг текста, по-другому стали фильтровать и размечать данные, иначе обрабатывать текст после перевода, чтобы исправлять ошибки. Сработало правило 10 тысяч часов: было много шажков к цели, и в определённый момент я понял, что качество перевода уже достаточно для того чтобы использовать его в API для собственных приложений. Потом мы начали подключать различные инструменты, которые позволяли и дальше улучшать качество перевода: определитель именованных сущностей, транслитерацию, тематические словари, систему исправления ошибок в словах.

  • Сайт на которых можно зарабатывать реальные деньги
  • «Я стал зарабатывать за день столько, сколько мне платили в месяц»
  • Заработать эфириум
  • Что такое торговать бинарными опционами
  • Какая прибыль у торгового робота

За 5 месяцев этой работы качество переводов на некоторых языках стало значительно лучше и люди начали меньше жаловаться. Это был переломный момент. Ты уже можешь продать программу, и из-за того что у тебя есть свое API для перевода, можно сильно сократить расходы. Можно наращивать продажи или количество пользователей, ведь расходы будут только на сервера. Для обучения нейронной сети нужен был хороший компьютер.

Но мы экономили. Сначала мы арендовали 20 обычных компьютеров с одной GTX и одновременно запускали на них 20 простых тестов через Lingvanex Control Panel. На каждый тест уходило по неделе, это было долго.

как я начал зарабатывать деньги

Чтобы добиться лучшего качества, нужно было запускать с другими параметрами, которые требовали больше ресурсов. Требовалось облако и больше видеокарт на одной машине. Он быстрый, но очень дорогой. В то время было очень мало вариантов аренды мощных GPU сервероров.

Пришлось отказаться от этой идеи и искать варианты дешевле. Может, попробовать собрать свой? Обзвон компаний заканчивался тем, что мы сами должны были прислать детальную конфигурацию, а они его соберут. Попытались заказать в Москве — наткнулись на какую-то подозрительную фирму.

  • Биржевые сводки опционы
  • Как я уволился с работы и начал зарабатывать онлайн. | VK
  • Литература о торговле на бинарных опционах
  • Возможности интернет заработка
  • Самые легкие способы заработать денег

Сайт был качественный, отдел продаж — в теме. Но банковский перевод они не принимали, и единственным вариантом оплаты был скинуть деньги на карту их бухгалтеру.

Стали совещаться с командой и решили, что можно самостоятельно собрать компьютер из нескольких мощных GPU и ценой до 10 тысяч долларов, который будет решать наши задачи и окупится за месяц. Комплектующие буквально скребли по сусекам: звонили в Москву, что-то заказывали в Китае, что-то в Амстердаме.

Через месяц все было готово.

как я начал зарабатывать деньги

В начале у себя дома я наконец-таки собрал этот компьютер и начал проводить много тестов, не беспокоясь, что нужно платить за аренду. Но я не понимал этот язык и на ночь поставил тренироваться модель англо-русского переводчика, чтобы понять, в какой точке нахожусь. Компьютер всю ночь гудел и жарил, спать было невозможно.

как я начал зарабатывать деньги

Нужно как я начал зарабатывать деньги следить, чтобы не было ошибок в консоли, так как периодически все зависало. Утром я запустил тест на перевод предложений с длинами от 1 до слов и увидел, что получился хороший перевод, в том числе на длинных строках. Эта ночь изменила всё.

Я увидел свет в конце тоннеля, что все же можно когда-нибудь добиться хорошего качества перевода.

«Я стал зарабатывать за день столько, сколько мне платили в месяц»

Улучшаем качество приложений Заработав деньги на iOS переводчике с одной кнопкой и одной функцией, я решил улучшить его качество, а также сделать версию для Android, Mac OS, Windows Desktop. Надеялся, что когда у меня будет свое API, я закончу разработку приложений и зайду на другие рынки.

За то время, когда я решал задачу своего API, конкуренты ушли намного. Нужны были какие-то функции, ради которых будут скачивать именно мой переводчик. Первое, что я решил сделать, это голосовой перевод для мобильных приложений без доступа в интернет. Это было личной проблемой. Например, Вы едете в Германию, скачиваете только немецкий пакет на телефон мб и получаете перевод с английского на немецкий и обратно. На самом деле, проблема интернета в зарубежных странах стоит остро.

Wifi либо нет, либо он запаролен или просто медленный, в итоге им невозможно пользоваться. Хотя качественных приложений переводчиков, которые работают только через интернет, используя API Google, даже в году были тысячи. Так как с Lua Torch -версией OpenNMT у многих были проблемы ввиду не очень широкой распространенности языка, основатели перенесли логику скрипта translate.

На Lua-версии можно было тренировать модели, на C-версии запускать. К маю года это уже можно было хоть как-то использовать за основу роботы для торговли бинарными опционами для приложений. Мы портировали CTranslate для работы под приложения и выложили все это в opensource.

Вот ссылка на эту ветку: github. Нужно было понять, как сделать офлайн модели небольшого размера и нормального качества для работы в телефонах и компьютерах.

Первые версии моделей для перевода занимали в оперативной памяти телефона 2GB, что абсолютно никуда не годилось. Я нашел ребят в Испании с хорошим опытом в области проектов по машинному переводу. Размер нужно было уменьшать таким образом, чтобы в определенный размер словаря к примеру, 30 тыс слов вложить как можно больше вариантов по переводу слов разных длин и тематик.

Позже результат наших исследований был выложен в открытый доступ и представлен на Европейской ассоциации машинного перевода в г. Аликанте Испания в мае года, а один из членов команды защитил по ней PhD. Офлайн перевод на нейронках для телефонов был готов уже в марте года, и можно было сделать его на все остальные языки до лета.

Но по договору я не мог получить исходники и используемые для этого инструменты, чтобы сделать офлайн переводчик на других языках. Нужно было внимательно читать договор. В одиночку я не мог быстро воспроизвести результаты на другие языки. Пришлось приостановить эту функцию. Спустя год я вернулся к ней и доделал.

Помимо перевода текста, голоса и картинок, было решено добавить перевод телефонных звонков с транскрипцией, которой не было у конкурентов.

Был расчет на то, что люди часто звонят в поддержку или по вопросам бизнеса в разные страны, причем на мобильный или стационарный телефон. Тому, кому адресуется звонок, не нужно устанавливать приложение.

как я начал зарабатывать деньги

Эта функция потребовала много времени и затрат, поэтому позже было решено вынести ее в отдельное от основного приложение. Так появился Phone Call Translator. У приложений для перевода была одна проблема — ими пользуются не каждый день. Не так много в жизни ситуаций, когда нужно переводить ежедневно. А вот если изучаешь язык, использование переводчика становится частым. Для изучения языков мы создали функцию карточек, когда слова добавляются в закладки на сайте через расширение для браузера или в субтитрах к фильму, а потом происходит закрепление знаний с помощью мобильного приложения чат-бота или приложения для умной колонки, которая будет проверять выбранные слова.

Все приложения Lingvanex связаны между собой единым аккаунтом, поэтому можно начать переводить на мобильном приложении и продолжить на компьютере.

Также добавили голосовые чаты с переводом. Это будет полезно для туристических групп, когда гид может говорить на своем языке, а каждый из посетителей будет слушать в переводе. И в конце — перевод больших файлов на телефоне или компьютере. Проект Backenster За 7 лет я получил 35 миллионов скачиваний без затрат на рекламу и заработал более 1 млн долларов. Из них почти половина — переводчики. Это были тестовые приложения, чтобы научиться мобильному маркетингу.

Из-за большого количества ошибок миллионы пользователей как пришли, так и ушли.

Получив необходимый опыт, я принимаю решение создать небольшой внутренний подпроект Backenster для управления приложениями, рекламой и аналитикой, чтобы на качественных переводчиках не повторить ошибок прошлого и зарабатывать максимально.

Через эту систему я собираюсь перенаправить пользователей своих старых приложений-переводчиков в новые, так как на закупку трафика денег. Еще где-то млн старых приложений осталось на телефонах. Это обойдется в разы дешевле, чем привлекать то же количество пользователей платно. Постепенно добавилась система управления тестами, подписками, обновлениями, конфигурацией, уведомлениями, медиатор рекламы и др.

Я решил предусмотреть все проблемы, которые возникли за это время с приложениями. Перспектива и стратегия Создавая API для своих приложений и вложив кучу денег, нужно понимать объем и перспективы рынка машинного перевода.

В году был прогноз, что рынок к году станет 1. Почему такая разбежка — около 50 раз? Самое большие расходы в переводе — это корректура, то есть зарплаты людей. Цифры и расчет выше даны приблизительно, чтобы передать суть. По мере развития качества машинного перевода все большая его часть будет заменять рынок ручного перевода и экономить на расходах по зарплате. Не обязательно стараться охватить все языки, можно выбрать популярную пару англо-испанский и одно из направлений медицина, металлургия, нефтехимия и др.

А каждый следующий процент улучшения качества будет даваться труднее. Стратегия больших компаний по созданию своих наработкок opensouce как я начал зарабатывать деньги приносить свои плоды. Стало больше стартапов, научных работ и людей в индустрии, что позволило раскачать рынок и добиваться все лучшего качества перевода, повышая прогноз по рынку машинного перевода. Каждый год проводятся соревнования по задачам NLP, где корпорации, стартапы и университеты соревнуются у кого будет лучше перевод на определенных языковых парах.

Анализируя список победителей, появляется уверенность, что небольшими ресурсами можно добиться отличного результата. Открытие компании За несколько лет проект вырос во. Появились приложения не только для мобильных платформ, но и для компьютеров, носимых устройств, мессенджеров, браузеров, голосовых ассистентов.

Помимо перевода текста был создан перевод голоса, картинок, файлов, сайтов и телефонных звонков. Вначале я планировал делать свое API для перевода, чтобы использовать только для своих приложений. Но потом решил предложить его всем желающим.

как я начал зарабатывать деньги

Конкуренты ушли вперед, и нужно было не отставать. До этого времени я управлял всем в как я начал зарабатывать деньги как индивидуальный предприниматель, наняв людей на аутсорсе.

как я начал зарабатывать деньги

Но сложность продукта и количество задач начали быстро расти, и стало очевидно, что нужно делегировать функции и быстро нанимать людей в собственную команду в своем офисе.

Я позвонил другу, он уволился с работы и принял решение открыть в марте года компанию Lingvanex До этого момента я создавал проект, нигде не рекламируясь, и когда решил собрать свою команду, столкнулся с проблемой поиска. Никто не верил, что это вообще можно сделать, и не понимал. Пришлось собеседовать многих людей и каждому по 3 часа рассказывать о тысячах неочевидных деталей.

Когда вышла первая статья о как я начал зарабатывать деньги, стало проще. Это позволяет сохранить приватность данных, не зависеть от объема переведенного текста и оптимизировать перевод под специфику конкретной компании.

Можно сделать качество перевода лучше конкурентов на определенные языковые пары или темы. Можно и на .