• Візуальний пошук стає такою ж важливою складовою "всесвітньої павутини", як і традиційний текстовий. Однак існуючі на сьогодні рішення не завжди можуть гідно відповісти на запити користувачів. Які технології дадуть реальну ефективність? Розглянемо реалії ринку.
    Більше половини обсягу головного мозку використовується для розпізнавання візуальних образів. Найскладніше при цьому визначити контекст видимого зображення, тобто відповісти на питання "Що це" Адже для цього потрібно зіставити отримане зображення з мільйоном образів, накопичених в процесі розвитку і навчання.
    Комп'ютер з подібними завданнями справляється значно краще. Тим не менш, з 70-х років минулого століття, коли вчені почали захоплюватися системами технічного зору, вражаючого прориву так і не відбулося. Складність завдання явно недооцінили - проблема якісного пошуку по зображеннях залишається невирішеною досі.
    Традиції
    зараз до питання пошуку по зображеннях традиційні пошукові системи підходять з тими ж алгоритмами, що і до пошуку по тексту, індексуючи тільки ті зображення, які містять у своєму описі ключові слова і фрази. Семантичний робот - серце будь-якої пошукової системи - "зчитує" текстовий опис зображення (назва файлу, посилання з картинки, а також супровідний текст на сторінці навколо картинки), будує індекс відповідності шуканого зображення і має знову знайдений об'єкт вище або нижче у результатах пошуку в залежності від ступеня відповідності пошуковому запиту.
    Однак проблема полягає в тому, що більше 99% всіх розміщених в інтернеті зображень не мають текстових міток, а за найменування файлів "відповідає" чіп у фотоапараті. Чи варто говорити, що описати кожне знову з'являється в інтернеті зображення вручну не представляється можливим.
    У результаті пошукові роботи щодня проходять повз мільярдів нових зображень, споживач не може знайти цікаві і потрібні йому картинки, автори зображень втрачають потенційну аудиторію, а соціальні мережі, фотохостінги і фотостоки недоотримують доходи від реклами або продажу прав на використання зображень.
    Ідеї
    Якщо трохи помріяти, то можна припустити, що цілий ряд індустрій зміниться до невпізнання, коли з'явиться працюючий адекватний, масовий візуальний пошук. База даних Google містить інформацію про парі десятків мільярдів зображень, решта трильйони являють собою "темну матерію" інтернету - вона займає дисковий простір, але доступна тільки автору і двох-трьох його друзям.
    Хтось скаже, що всі ці трильйони зображень йому не потрібні, тому що вони не представляють ніякої цінності. Так, вони не потрібні, але серед них є тисячі, які відповідають поточним інтересам або запитам конкретної людини. Причому запитам не текстовим, а візуальним. Наприклад, роздивляючись фотографію сучасного міста, подпирающего небо вежами хмарочосів, хочеться дізнатися більше про це місце. Десятки тисяч людей були там, залишивши свої спогади на фотохостингах і в соціальних мережах, але зараз доводиться заново розміщувати фотографію, наприклад, на віртуальній стіні і питати друзів "хто-небудь дізнається це місце"
    Споживачі
    Очевидно, що коло для застосування технології візуального пошуку дуже широкий: починаючи від промислових завдань з області медицини, геології, безпеки і захисту авторських прав і закінчуючи простими запитами звичайних інтернет-користувачів. Наведемо приклад кілька ситуацій.
    У гарному магазині в торговому центрі досвідчений продавець задасть клієнту пару уточнюючих запитань і запропонує декілька варіантів. Інтернет-торгівля досі не приносить психотерапевтичного задоволення від розміреності у виборі товару - адже сайти оперують обмеженим набором категорій і параметрів. У свою чергу, візуальний пошук дозволяє як шаблон використовувати будь-яке зображення, що часом значно спрощує процес пошуку "такого ж, але без крил".
    В пошукових системах пошук зображення для ілюстрації замітки в соціальній мережі, блозі або на аватарку стійко входить в трійку найпопулярніших запитів по зображеннях. Очевидно, що ефективна система візуального пошуку полегшить і спростить його.
    Технооснова
    Все перераховане вище - поки мрії. Щоб вони перетворилися в реальність, необхідна працює технологія, здатна швидко - за частки секунди - знаходити схожі зображення і ранжувати їх, як це робить класична пошукова система з текстовою інформацією. При цьому не потрібні ніякі сверхразработки - весь математичний апарат для технічного зору був розроблений ще в 80-х роках минулого століття, а технології обробки величезних масивів інформації доступні за ліцензії з відкритим кодом.
    Крім того, слід навчитися індексувати десятки мільярдів зображень - знімаючи з них "цифровий відбиток" для подальшої ідентифікації і видаляючи оригінал після цього (щоб не дублювати весь інтернет у себе і не порушувати права автора зображення). Ці технології також відпрацьовані в рамках існуючих пошукових систем.
    І, нарешті, потрібна бізнес-модель. Споживачі звикли до того, що пошук - це безкоштовна послуга. Відучити їх вже пізно. Значить, потрібно знайти механізм заробляння грошей на результатах пошуку, благо що вони можуть представляти і комерційну цінність.
    Реалії ринку
    В цілому близько 50 компаній по всьому світу включилася в гонку за головний приз - лідерство в сфері споживчого пошуку зображень. Зокрема, молода пітерська компанія Kuznech на кошти дослідницького гранту Сколково допрацювала і запустила технологію створення та порівняння "цифрових відбитків мільярдів зображень по сотнях різних параметрів, включаючи композицію, контрольні точки і лінії, кольори, текстури. Тепер можна задати будь-яку картинку у якості шаблону для пошуку і знайти схожі зображення у всій проіндексованої базі.
    "Зараз у тестовій базі Kuznech всього кілька мільйонів зображень, - розповідає Михайло Погребняк, засновник і генеральний директор Kuznech, - ми відпрацьовуємо механізми схожості, експериментуємо з призначеним для користувача інтерфейсом, зрозумілим широкому колу споживачів. Доводиться вирішувати багато питань не тільки технічних, але навіть з області психології. Наприклад, чоловіки і жінки по-різному визначають поняття візуальної схожості. Це все потрібно враховувати".
    Засновники Kuznech припускають в першу чергу використовувати свою технологію у партнерстві з великими фотохостингами, соціальними мережами, бібліотеками зображень - так легше отримати доступ до великих масивів зображень, а також достукатися до широкого кола користувачів, не вкладаючи в рекламу.
    Результати пошуку можуть регулюватися в залежності від завдання. Наприклад, пошук товарів в інтернет-магазині орієнтований на визначення яскравих чітких об'єктів на білому або однотонному тлі, а пошук ілюстрації для сайту або блогу більш чутливий до кольорів і текстур. У перспективі, поєднуючи візуальні переваги споживача з його соціально-демографічними характеристиками можна буде пропонувати будь-якому користувачеві релевантні та цікаві зображення. Частково цю проблему зараз вирішує Pinterest - найдинамічніша у світі соціальна мережа, де користувачі "розповідають візуальні історії", збираючи колекції улюблених зображень і публікуючи їх для широкого кола своїх передплатників.
    Зараз в кишенях мільярдів людей лежать потужні засоби створення фото і відео, а системи зв'язку здатні за секунди розмістити нові дані в практично безмежних мережевих сховищах. Зростання візуального онлайн-контенту йде в геометричній прогресії. За словами Сергія Білоусова, засновника і головного архітектора компанії Parallels, якщо до 2000 року вся людська цивілізація накопичила близько 1 мільярда зображень, то в червні 2012 року таку ж кількість розміщується в Мережі кожні кілька годин. "Кількість опублікованих в інтернеті зображень перевалила за 3 трильйони і продовжує рости", - упевнений він.br/>Свої дослідницькі підрозділи, які займаються цією проблематикою, є в Amazon, Google, Microsoft, Hitachi. Канадська компанія Idee вже кілька років тому запустила свій пошуковик зображень під назвою TinEye з проиндексированным каталогом в 4 мільярди зображень - він, правда, орієнтований на пошук дублікатів зображень, а не схожих. Це не дивно, адже основна спеціалізація материнської компанії - захист прав інтелектуальної власності на зображення в інтернеті і друкованих виданнях. Цікавий споживчий продукт на основі пошуку схожих зображень пропонує ізраїльський стартап Superfish - користувач може безкоштовно встановити плагін до браузера, який для кожного зображення продукту в інтернеті буде показувати аналогічні пропозиції інших магазинів - раптом знайдеться щось дешевше. "Тенденція до збільшення пропозиції програмних продуктів у сфері візуального пошуку буде тільки підсилюватися, оскільки саме ця сфера на найближчі 10 років стане основним "полем битви" лідерів іт-індустрії, починаючи з найбільших пошукових систем і закінчуючи національними операторами інтернет торгівлі. Той, хто зуміє грамотніше і швидше інтегрувати візуальний пошук під потреби масового споживача, отримає шанс зберегти або завоювати глобальне лідерство в інтернет комерції, - говорить Олександр Потапов, виконавчий директор РВК.
    загалом, можна з упевненістю стверджувати, що хто б не переміг в цій гонці, протягом декількох років споживчий інтернет стане зовсім іншим - основну масу контенту в ньому будуть складати зображення та відео, а пошукові системи будуть вміти знаходити потрібну користувачеві інформацію на основі візуальної схожості, а не текстових описів. Так, як це робить людський мозок.