«РІФ + КІБ-2015»: Big Data

Секція «Велика аналітика: Big Data для держави і корпорацій»
Як стати майстром наскрізний аналітики?
Секція: «BigData для інтернет-магазину: обмеження і можливості»
Секція «Реклама в інтернеті: Data»

З 22 по 25 квітня в підмосковному пансіонаті «Поляни» відбулася щорічна конференція «РІФ + КІБ». Інтернет-форум щорічно збирає ключових гравців ринку, щоб обговорити проблеми та тренди і поділитися досвідом. На цей раз злободенними темами стали: e-commerce, performance marketing, веб-аналітика, RTB, Big Data, мобільна реклама та багато іншого.

Всього за три дні пройшло близько 100 конференційних заходів. З 10.00 до 12.00, з 12.30 до 14.30 і з 15.30 до 17.30 одночасно працювали близько 9 секцій, які можна було відвідувати у вільному режимі, переміщаючись з одного залу в інший. Також протягом усього форуму працювала виставка - територія пошуку партнерів і клієнтів. Її учасники за брендованими стендами розповідали про своїх сервісах, продукти та послуги.

Ми відвідали кілька секцій форуму, присвячених великим даними, і зібрали найцікавіші думки доповідачів.

Секція «Велика аналітика: Big Data для держави і корпорацій»

Олександр Хайтін

Yandex Data Factory

Як стати майстром наскрізний аналітики?

Наскрізна аналітика - головна магія інтернет-маркетингу і найпотужніший інструмент розвитку продажів без зростання бюджету. Впровадивши її, ви відразу зрозумієте, де клієнти губляться і що в вашому маркетингу треба поліпшити.
Хочете освоїти цю магію? Ось навчальний курс де детально пояснюють, як все працює, як впроваджувати і як використовувати на практиці.
Поспішайте дізнатися подробиці , Реєстрація скоро закриється!

Ми потрапляємо в світ надлишку даних. Я думаю, що через рік пишатися обсягом даних перестануть. Дані не треба збирати, досить їх не втрачати і використовувати. Що це можуть бути за дані? Про поведінку користувачів і клієнтів, про комунікації, продажах, зверненнях, банківські транзакції, кредитах, депозитах, виробничих операціях, дорожній рух, дані з сенсорів і телеметрія, - все це можна збирати терабайтами.

Навіщо? По-перше, для пошуку инсайтов: потрібно терміново щось дізнатися - використовуємо дані, які у нас є. По-друге, для виявлення правил. Наприклад, якщо абонент передзвонює, значить зв'язок поганий. Якщо зв'язок поганий, потрібно утримати абонента, що-небудь йому запропонувати. Таку інформацію можна використовувати для поліпшення роботи. Хоча не всі це роблять. Наприклад, прилітаю я в Пулково - а я часто літаю між Москвою і Санкт-Петербургом - тут же отримую смс: «Викликайте таксі в Петербурзі», а то, що я там живу, нікого не турбує. Я потрапив в правило: переліт Москва-Пітер, таргетування спрацювало. Видно, як працюють правила, але користі, як бачите, небагато. Правила - це грубий інструмент.

Існує технологія комплементарних даних, машинного навчання, коли з даних можна отримувати гроші. І ми можемо робити апсейл, крос-сейл, працювати на утримання, прогнозувати, використовуючи пророкують і розпорядчі моделі. Питання - чому машинне навчання? В ході аналізу великих даних машина може виділити 100 тисяч гіпотез проти 5-7, на які здатна людина. В результаті виходить модель, яка добре масштабується. Є гіпотези, кращі гіпотези, і, нарешті, з'являються правила, які можна застосовувати. Прості правила становлять 80%, і їх використовують все на ринку, питання в тому, як знайти інші 20%, які будуть ефективно працювати.

презентація « Yandex Data Factory. "Боротьба хорошого з кращим". Власні аналітики і сторонні сервіси »- Олександр Хайтін

Олександр Крот

ВАТ «Вимпелком» ( «Білайн»)

Перший тип завдань, які ми вирішуємо - це витяг прихованих ознак з текстових даних. Це може бути будь-яка інформація, числа, імена. Для цих цілей ми використовуємо Deep Learning - напрямок в області штучного інтелекту (Artificial Intelligence) і машинного навчання (Machine Learning), засноване на пошуку таких моделей і алгоритмів, завдяки яким комп'ютери зможуть вчитися на власному досвіді, формуючи в процесі навчання багаторівневі, ієрархічні уявлення про навколишній світ, сучасні методи машинного навчання. Другий тип завдань - це пошук зв'язків між людьми: через смс, телефонні розмови і так далі. Багато, напевно, чули про «теорії 6 рукостискань», так ось, якщо розглянути графи мережі «Білайн» і зв'язок між ними, то ми побачимо, що всі абоненти знайомі між собою всього через 4 рукостискання. Ще ми вирішуємо такі завдання, як кластеризація і прогнозування зв'язків. Ми можемо сказати, наприклад, що дві людини з великою ймовірністю через деякий час будуть спілкуватися. З інструментів в даному випадку використовується графовая аналітика. Завдання кластеризації ставляться для того, щоб з усіх наших абонентів виділити якісь типові кластери.

Ніяких точних гарантій і прогнозів замовнику ми дати не можемо. Найефективніший спосіб показати нашу роботу - це пілот. Клієнт бачить конверсії в продажу, вірить нам і більше не питає.

презентація « Big Data в Вимпелкомі: завдання, алгоритми та інструменти »- Олександр Крот, ВАТ« Вимпелком »(« Білайн »)

Дмитро Шпиль

IBM

Історично в компанії IBM було три підрозділи: софт, залізо і сервіси. Нещодавно наш генеральний директор оголосив про відкриття четвертого - Watson, і про те, що воно стає основним. Watson - це інноваційна технологія, яка є аналогом штучного інтелекту. Вона наводить факти, може бути навчаюсь, готова для використання в бізнесі.

Перший напрямок, який ми стали розвивати - охорона здоров'я. Реальна практика була в одній з клінік США. Спочатку Watson повинен був продіагностувати пацієнта на наявність ракової пухлини. Лікар визначав це з точністю до 30%, машина - з точністю до 70%. Далі ускладнили завдання: Watson попросили призначити курс лікування реальному пацієнтові. Машина запропонувала нестандартний спосіб, лікарі подумали, що Watson перегрівся. Виявляється, він знайшов дослідження, в якому описувався стався кілька років тому в Канаді випадок, який показує, що при такому перебігу раку, як у даного пацієнта, лікування традиційним методом може привести до смерті. Незважаючи на це, лікарі вибрали свій метод. Але побачивши через деякий час, що пацієнтові стає гірше, перейшли на курс, рекомендований Watson. Хворий вижив, машина врятувала життя людині.

Існує безліч сфер застосування Watson. Наприклад, створений Watson Adviser для інтеграції в інтернет-магазини: сервіс, який замінює консультанта в точці продажу. На головній сторінці магазину розміщується вікно, в якому людина пише, що він хоче купити. Система аналізує запит, дані про користувача і пропонує релевантні, як їй здається, товари. Також у нас є інструмент для управління репутацією в інтернеті, який може не тільки зібрати всі відгуки про вашу компанію, але і точно оцінити їх забарвлення (позитивну або негативну), чого не може зробити жодна інша система.

Watson не покликаний замінити людини, його завдання - йому допомогти, це його асистент.

презентація « Хто такий Watson? »- Дмитро Шпиль, IBM

Секція: «BigData для інтернет-магазину: обмеження і можливості»

Безкоровайний Денис

RISSPA

Великі дані в е-commerce - це не тільки персоналізація. Це також аналіз подій безпеки, результативності маркетингових кампаній, активності всередині додатків, продуктивності додатків, і як підсумок - прийняття рішень, заснованих на даних.

презентація « Великі дані - багато печалі. Ложка дьогтю в бочці переваг Big Data для e-commerce »- Денис Безкоровайний, RISSPA

Секція «Реклама в інтернеті: Data»

Євген Легкий

RuTarget.ru

Час куки йде, гряде час єдиного id. Офлайн і онлайн зростуться.

презентація « Segmento »- Євген Легкий, RuTarget.ru

Михайло Фірулік

Mail.Ru Group

З використанням Machine Learning можна встановлювати такі таргетинги:

Наявність освіти:

є вища;
немає вищого.

Зайнятість (TNS):

працює;
не працює.

Сімейний стан (TNS):

у шлюбі;
неодружений.

Індивідуальний дохід (дані TNS сумісні з даними WebIndex):

A - нижче середнього;
B - середній;
C - вище середнього;
D - високий;
E - преміум.

Телеперегляд (TNS):

LTV - мало дивляться ТВ;
MTV - середнє телеперегляд;
HTV - багато дивляться ТБ.

Середній сімейний дохід (TNS):

A - нижче середнього;
B - середній;
C - вище середнього.

Наявність дітей різного віку:

новонароджених до 1 року;
малюків від 1 до 3 років;
дошкільнят від 3 до 7 років;
школярів початкових класів;
школярів середніх і старших класів.

Професійні області через hh.ru.

У другому півріччі 2015 року очікуються нові таргетинги:

Наявність дітей до 16 років (TNS):

є діти;
немає дітей.

B2B або B2C:

B2B - працюєте нема на кінцевого споживача, а на компанії (юридичні особи);
B2C - працюєте на кінцевого споживача (приватні, фізичні особи).

Рід занять (TNS):

керівники;
фахівці;
робочі;
учні;
домогосподарки;
інші непрацюючі.

керівники; фахівці; робочі; учні; домогосподарки; інші непрацюючі

презентація « Варимо цільову аудиторію - індивідуальні рішення, універсальний підхід »- Михайло Фірулік і Микола Антохіна, Mail.Ru Group

Хочете освоїти цю магію?
Що це можуть бути за дані?
Навіщо?
Питання - чому машинне навчання?

«РІФ + КІБ-2015»: Big Data

Секція «Велика аналітика: Big Data для держави і корпорацій»

Як стати майстром наскрізний аналітики?

Секція: «BigData для інтернет-магазину: обмеження і можливості»

Секція «Реклама в інтернеті: Data»

Новости