Автоматизація: майбутнє науки про дані та машинного навчання?

Машинне навчання було одним з найбільших досягнень в історії обчислювальної техніки, і тепер воно розглядається як здатне відігравати важливу роль у сфері великих даних та аналітики. Аналітика великих даних - це величезний виклик з точки зору підприємства. Наприклад, такі заходи, як розуміння великої кількості різних форматів даних, аналіз підготовки даних та фільтрація зайвих даних, можуть бути ресурсомісткими. Прийом на роботу фахівців -дослідників даних є дорогою пропозицією, а не засобом досягнення мети для кожної компанії. Експерти вважають, що машинне навчання може автоматизувати багато завдань, пов'язаних з аналітикою - як рутинних, так і складних. Автоматизоване машинне навчання може звільнити значні ресурси, які можна використати для більш складної та інноваційної роботи. Машинне навчання, здається, весь час рухається в цьому напрямку.

Автоматизація в контексті інформаційних технологій

В ІТ автоматизація - це з'єднання різних систем та програмного забезпечення, що дозволяє їм виконувати конкретні завдання без будь -якого втручання людини. В ІТ автоматизовані системи можуть виконувати як прості, так і складні роботи. Прикладом простого завдання може бути інтеграція форм з PDF-файлами та надсилання документів правильному одержувачу, тоді як надання резервних копій за межами сайту може бути прикладом складного завдання.

Щоб правильно виконувати свою роботу, вам потрібно запрограмувати або дати чіткі вказівки автоматизованій системі. Кожного разу, коли для зміни обсягу своєї роботи потрібна автоматизована система, програму чи набір інструкцій потрібно хтось оновлювати. Хоча автоматизована система ефективна у своїй роботі, помилки можуть виникати з різних причин. Коли виникають помилки, потрібно виявити і усунути першопричину. Очевидно, що для виконання своєї роботи автоматизована система повністю залежить від людей. Чим складніший характер роботи, тим вище ймовірність помилок і проблем.

Поширеним прикладом автоматизації в ІТ-індустрії є автоматизація тестування веб-інтерфейсів користувача. Тестові приклади завантажуються в сценарій автоматизації, і відповідним чином перевіряється інтерфейс користувача. (Детальніше про практичне застосування машинного навчання див. Машинне навчання та Hadoop у Розкритті шахрайства наступного покоління.)

Аргументом на користь автоматизації є те, що вона виконує рутинні та повторювані завдання та звільняє співробітників від виконання складніших та творчих завдань. Однак також стверджується, що автоматизація виключає велику кількість завдань або ролей, які раніше виконували люди. Тепер, коли машинне навчання входить у різні галузі, автоматизація може додати новий вимір.

Майбутнє автоматизованого машинного навчання?

Суть машинного навчання - це здатність системи безперервно вчитися на даних та розвиватися без втручання людини. Машинне навчання здатне діяти як людський мозок. Наприклад, механізми рекомендацій на веб-сайтах електронної комерції можуть оцінити унікальні уподобання та смаки користувача та надати рекомендації щодо найбільш прийнятних продуктів та послуг на вибір. З огляду на цю можливість машинне навчання розглядається як ідеальне для автоматизації складних завдань, пов'язаних з великими даними та аналітикою. Вона подолала основні обмеження традиційних автоматизованих систем, які не дозволяють регулярно втручатися людині. Існує декілька тематичних досліджень, які демонструють здатність машинного навчання виконувати складні завдання аналізу даних, про що йтиметься далі у цій статті.

Як уже зазначалося, аналіз великих даних - це складна пропозиція для бізнесу, яку можна частково делегувати системам машинного навчання. З точки зору бізнесу, це може принести багато переваг, таких як звільнення ресурсів науки про дані для більш творчих та критично важливих завдань, більші навантаження, менший час на виконання завдань та економічна ефективність.

Вивчення проблеми

У 2015 році дослідники Массачусетського технологічного інституту розпочали роботу над інструментом науки про дані, який може створювати прогнозовані моделі даних з великої кількості необроблених даних за допомогою техніки, яка називається алгоритмами глибокого синтезу функцій. Вчені стверджують, що алгоритм може поєднувати найкращі риси машинного навчання. За словами вчених, вони протестували його на трьох різних наборах даних і розширюють тестування, щоб включити ще більше. У документі, який буде представлений на Міжнародній конференції з науки про дані та аналітику, дослідники Джеймс Макс Кантер та Кальян Веерамачані сказали: «Використовуючи автоматизований процес налаштування, ми оптимізуємо весь шлях без участі людини, дозволяючи йому узагальнити його для різних наборів даних».

Давайте подивимось на складність завдання: алгоритм має те, що відоме як можливість автоматичного регулювання, за допомогою якого можна отримати або витягти уявлення чи значення з необроблених даних (таких як вік чи стать), після чого прогнозовані дані можна створювати моделі. Алгоритм використовує складні математичні функції та теорію ймовірностей під назвою Гаусова копула. Тому легко зрозуміти, наскільки складним може бути алгоритм. Ця техніка також займала призові місця на конкурсах.

Машинне навчання може замінити домашнє завдання

У всьому світі обговорюється, що машинне навчання може замінити багато робочих місць, оскільки воно виконує завдання з ефективністю людського мозку. Насправді існує певна стурбованість тим, що машинне навчання замінить дослідників даних, і, здається, є підстави для такої занепокоєння.

Для звичайного користувача, який не має навичок аналізу даних, але має різний ступінь аналітичних потреб у повсякденному житті, неможливо використовувати комп’ютери, які можуть аналізувати величезні обсяги даних та надавати дані аналізу. Однак методи обробки природної мови (NLP) можуть подолати це обмеження, навчивши комп’ютери приймати та обробляти природну людську мову. Таким чином, звичайному користувачеві не потрібні складні аналітичні функції чи навички.

IBM вважає, що потреба вчених у сфері даних може бути мінімізована або усунена за допомогою її продукту, платформи Watson Natural Language Analytics. За словами Марка Атшуллера, віце -президента з аналітики та бізнес -аналітики компанії Watson, «З такою когнітивною системою, як Watson, ви просто задаєте своє питання - або якщо у вас немає запитання, ви просто завантажуєте свої дані, і Watson може подивитися на них і зробіть висновок про те, що ви могли б хотіти знати. ”

Висновок

Автоматизація-це наступний логічний крок у машинному навчанні, і ми вже відчуваємо наслідки у своєму повсякденному житті-сайти електронної комерції, пропозиції друзів у Facebook, пропозиції мережі LinkedIn та рейтинги пошуку Airbnb. Беручи до уваги наведені приклади, немає жодних сумнівів, що це можна пояснити якістю результатів, які виробляють автоматизовані системи машинного навчання. Незважаючи на всі свої якості та переваги, ідея машинного навчання, що викликає величезне безробіття, виглядає дещо надмірною. Машини замінюють людей у ​​багатьох частинах нашого життя протягом десятиліть, але люди еволюціонували та адаптувалися, щоб залишатися актуальними у промисловості. Відповідно до точки зору, машинне навчання при всіх його порушеннях - це лише чергова хвиля, до якої люди пристосуються.


Час публікації: 03 серпня-20 серпня