Машинное обучение, глубокое обучение и обучение с подкреплением: практически омонимы? Не совсем.
Мы решили начать с главного, чтобы вы тоже могли разговаривать с датасайнтистами и не испытывать неловкость.
Судя по последнему отчету ВЦИОМ, парадокс в том, что почти весь бизнес в курсе про то, как искусственный интеллект (ИИ) шагает по стране, но каждый седьмой предприниматель заявил, что не может объяснить, что такое ИИ.
Секрет успешного успеха искусственного интеллекта в том, что не всё ИИ, что им назвали. И если коротко, то искусственный интеллект от самозванца отличает, в основном, способность учиться и интерпретировать.
ИИ – самый собирательный образ из всех здесь присутствующих. Он про то, как научить машину думать и делать как нужно человеку. И здесь есть методики.
Машинное обучение – это как раз методика обучения и следующий по собирательности образ, он внутри ИИ. Суть методики в том, что машина воспринимает информацию не по принципу «сказал-сделал», она учится. Машине дают много примеров или дают инструменты и цель, и в какой-то момент она понимает, как правильно решать задачу. Понимает сама.
Есть множество подвидов машинного обучения. Из тех, которые особенно на слуху выделим обучение с учителем, обучение без учителя и обучение с подкреплением.
Обучение с учителем (Supervised Learning) – это когда у машины есть куча примеров «входа-выхода», и она после долгого изучения примеров, получая «вход», знает, где «выход». Грубо говоря, мы показываем машине тысячу картинок с зайцем и тысячу – без зайца, потом показываем новую картинку, и машина говорит: это заяц!
Обучение без учителя (Unsupervised Learning). Тут у машины есть «вход», «инструменты» и «цель», а дальше она пробует достичь цели. Больше нет стопки картинок с зайцами и не зайцами. Здесь в виде «входа» - картинки с разными животными, но нигде не сказано, кто есть кто. Машина находит общие черты (уши, лапы, хвосты) в данных и реагирует на наличие или отсутствие таких же черт в каждом новом фрагменте данных. Целью может быть, например, группировка по стопочкам животных одного вида.
Обучение с подкреплением или с обратной связью (Reinforcement Learning). Здесь машина не просто должна достичь цели, – она должна сделать это максимально эффективно. Как ребёнок-отличник, от которого родители требуют не просто 5, а 5+ и «молодец» в дневнике. Такую методику в ИИ применяют при создании автономных транспортных средств или в играх против человека (типа шахмат или го).
Глубокое обучение (Deep learning). Глубокое обучение – подмножество машинного обучения, но с использованием нейронных сетей.
Уточним: искусственная нейронная сеть – это математическая модель (её программное или аппаратное воплощение), которая пытается повторить взаимодействие нервных клеток живого организма.
Если при прочих видах машинного обучения входные данные нужно размечать (то есть указывать ИИ, что вот так выглядят лапы, а вот так – хвосты), в случае нейросетей системе не требуются для обучения размеченные и структурированные данные. То есть вмешательство человека исключено, а ключевым фактором эффективности ИИ является качество и количество предоставленных данных.
Резюме
Машинное обучение может использовать нейронные сети, а может не использовать. То есть бывает «дип лёрнинг», «реинфорсмент лёрнинг» и комбо «дип реинфорсмент лёрнинг». И это всё разные, но пересекающиеся категории.