Растительным маслом в случае машинного обучения являются данные, используемые для обучения. Если данные загрязнены — по ошибке или предвзятости — тоже самое будет происходить с паттернами, которые появятся на основе введенных данных.
Конечно, адепты ML знают об этом, и самые сознательные из них идут на серьезные жертвы ради обнаружения необъективности. Тем не менее в большинстве ситуаций учебные комплекты представляют собой коллекции повседневных бесед, взятых, к примеру, из социальных сетей. Казалось бы, ничего неожиданного — всего лишь повседневная речь.
Но примечательно вот что: согласно исследованиям Принстонского университета и других образовательных центров, даже повседневная речь обладает скрытыми свойствами, которые очень сложно заметить.
«Сам язык содержит восстанавливаемые и весьма точные слепки наших исторических убеждений», — пишут авторы исследования, обращаясь к расовым, половым и прочим нетривиальным вопросам. Конечно, эти скрытые пристрастия мгновенно отражаются на машинном обучении.
Надо думать, австрийский философ Людвиг Витгенштейн полюбил бы эти исследования, ведь они лишь подтверждают его уверенность в том, что значение слова не стоит искать в каком-то абстрактном определении. Достаточно проследить его использование в повседневной речи. Сторонникам ML стоит обратить внимание на его «Трактат».
Отрицать преимущества машинного обучения глупо. Человечество накопило слишком много данных, и с появлением новых систем глубокого изучения затраты на их обработку снижаются. К тому же система, обученная на релевантных наборах данных, в нескольких итерациях предлагает хорошие варианты исполнения конкретной задачи, будь то распознавание лиц, речи или изображений.
Уже сегодня ML позволяет предприятиям не только обнаруживать закономерности в своих процессах, но и автоматизировать анализ данных, который традиционно осуществляли люди. Все это ведет к существенному удешевлению услуг и продуктов, а, значит, новаторы машинного обучения достойны самых высоких похвал. Тут как нельзя кстати подойдет заглавие «Дивного мира» Олдоса Хаксли: