Diffbot: компания, которая знает больше Google

« Март 2026 »
Пн	Вт	Ср	Чт	Пт	Сб	Вс
	1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31

24 июля 2019 utmedia

Если вы никогда не слышали про компанию Diffbot — не расстраивайтесь, про нее вообще мало кто слышал. Она была создана 10 лет назад Майком Тангом, тайваньцем, чья семья перебралась в США для того, чтобы его отец мог получить высшее образование.

Согласно официальной легенде, Танг с детства был свернут на том, чтобы получить как можно больше информации, например, рассказывают, что он честно пытался прочитать вообще все книги, пользуясь возможностями библиотеки своего небольшого города и осознал бесперспективность своего занятия только тогда, когда оказался в библиотеке побольше. Сочетание желания получить всю возможную информацию с явной предрасположенностью к занятиям программированием в результате привело к неординарным результатам.

Предпосылки
Закончив Калифорнийский университет в Беркли, получив степень магистра в области искусственного интеллекта в Стэнфорде и поступив в аспирантуру там же, после окончания работы в Microsoft, во время работы в Yahoo наш герой приступил к попыткам создания поисково-аналитической системы, которая бы выдавала не ссылки, с помощью которых пользователю надо добывать нужную информацию, но полностью готовый ответ на вопрос или, в крайнем случае, структурированную базу релевантных данных, готовую для анализа.

После целого ряда неудачных попыток Танг сделал приложение, которое неплохо справлялось с поиском и сортировкой новостей в интернете, причем делало это достаточно эффективно, чтобы возможностями новой программы пожелала воспользоваться небезызвестная AOL, заплатившая за эту возможность, согласно открытым источникам, несколько сотен тысяч долларов. Решив, что это знак (а кто бы так не решил) Танг увольняется отовсюду и начинает заниматься развитием собственной системы, которая бы позволила пользоваться интернетом как базой данных.

Дальше, как и почти в ста процентах подобных историй, есть некая недоговоренность, ибо во всех хронологиях событий, связанных с Diffbot, внезапно (sic!) Танг встречается с Энди Бехтольшаймом, миллиардером и одним из первых инвесторов Google, который сразу дает ему сто тысяч долларов, а потом еще сто тысяч долларов. Сразу после этого в проект вкладывают 2 миллиона некие неназванные бизнес-ангелы и 10 миллионов — Felicis Ventures, компания, которая специализируется на инвестициях в перспективные IT-стартапы, которые затем часто покупаются всякими там Microsoft, Cisco и Disney.

Что есть
С такими деньгами уже можно жить, команда проекта растет и ее услугами пользуются все большее количество корпоративных клиентов, которые платят совершенно неиллюзорные деньги.

Так о чем идет речь, спросите вы? А речь на данный момент идет о самой большой в мире базе фактов, которая на данный момент больше Google Knowledge Graph почти в пятьдесят раз (не путать с базой ссылок!). В Google Knowledge Graph сейчас содержится порядка 18 миллиардов фактов, а в Diffbot Knowledge Graph — триллион, причем каждый месяц это число растет на 130 миллионов.

По расчетам представителей Diffbot, сотрудники компаний в среднем тратят тридцать процентов рабочего времени на поиск и структурирование информации, полученной ими в поисковой выдаче. Diffbot делает это за них.

К примеру, захотела некая организация узнать, что собой представляют люди, которые приняли участие в проведенной ею выставке. Diffbot соберет данные об участниках из всех возможных источников, выдаст их моментально, причем в удобном для софта, который используется заказчиком для анализа, виде. Хотите узнать, какие люди работают в компании, с которой вы собираетесь подписать контракт? Пожалуйста — через несколько секунд у вас их биографии и резюме, скомпилированные из открытых источников, проанализированные и содержащие только те данные, которые система сочла достоверными на основе перекрестных проверок.

Представители Diffbot утверждают, что на данный момент их база данных содержит информацию о 99 процентах страниц сети. Их система интегрируется в любой инструментарий, используемый крупными компаниями. По сути, если использовать эту систему, то у организации должна резко снижаться потребность в «чистом», неадаптированном интернете. И правда — зачем нужны многочисленные результаты поиска, есть один полноценный ответ?

Что может быть
Логическим результатом развития подобного рода обработчика данных в сети должна знать система, которая сможет давать конкретные ответы на заданные вопросы произвольной сложности, подготовленные для дальнейшего использования любыми вычислительными комплексами на базе нейросетей. И как это не странно звучит, если все вышесказанное - правда, то у мало кому сейчас известного стартапа перспективы таковы, что впору самому Alphabet начинать нервно оглядываться, по крайней мере, тому его подразделению, которое отвечает за семантический анализ и поиск. Тем более, что вдруг Тангу придет в голову освоить рынок поиска для конечного пользователя? Или его вдруг в себя какая-нибудь Facebook интегрирует? Вангую, тогда из этой соцсети граждане вообще перестанут куда-либо ходить.

Поэтому имеет смысл раз в месяц или два интересоваться — как там дела у предприимчивого тайваньца? И если вдруг вы когда-нибудь прочитаете, что Diffbot собрался на IPO или, что не менее вероятно, его собирается купить какой-нибудь высокотехнологичный гигант, задумайтесь — а не вложить ли денег в эту историю, ибо в обоих случаях сразу после того как денег станет заметно больше, чем было до.

/ Источник

Не является индивидуальной инвестиционной рекомендацией | При копировании ссылка обязательна | Нашли ошибку - выделить и нажать Ctrl+Enter | Жалоба