データサイエンスの始め方・データ分析のデザインパターン

日時:2013/08/09

場所:株式会社リクルートテクノロジーズ

Twitterハッシュタグ:#ds2013

Togetter:http://togetter.com/li/548111

Ustream:http://www.ustream.tv/channel/td-channel

イベントページ:データサイエンスの始め方・データ分析のデザインパターン on Zusaar

WEB業界は出席者の半分程度

誰も語らないデータ分析の3つの現実

Video streaming by Ustream

入力データがごみだと結果もゴミ

「データを集める人」と「分析する人」の接点がない

データをあつめるしくみが複雑

インフラ技術が会社のコアでないかぎり、データ基盤の内製は必ずしも正しくない。時間的な意味で

スキーマレスなログデータの収集と集計のためのデザインパターン

Video streaming by Ustream

ログを集めたり集計したりするのは大変である。知り合いがMongoDBでやったが大変だった。

ログをどう集めるのか

ログの設計について

ログデザインパターン

スキーマーレスといえどログ設計はきちんとする

リクルートグループにおける情報活用事例

Hadoop:リサーチ段階として3,4台で初め、現在は100台以上で構築

各種機能はエコシステムで簡単に使用 Hiveとか

ビッグデータの取り組み
リクナビ→学生の閲覧・行動履歴を元に100件企業をレコメンド

Persuading customers : insights into emotional value from big data
(お客様を説得する:データサイエンスで読み解く感情価値)

Video streaming by Ustream

A社と楽天のサイトデザインの違い→Topページはそんなに違わないが、顕著なのは商品ページ。

A社は理性にアピールつくり、楽天は感情にアピールするつくり(国民性の違い)

良いサービスはユーザーの深い欲望でできている

ユーザの深い欲望をどうやって理解すればいいのか

顧客の声を聞くのではなく、行動を見る

コメントを残す

以下に詳細を記入するか、アイコンをクリックしてログインしてください。

WordPress.com ロゴ

WordPress.com アカウントを使ってコメントしています。 ログアウト / 変更 )

Twitter 画像

Twitter アカウントを使ってコメントしています。 ログアウト / 変更 )

Facebook の写真

Facebook アカウントを使ってコメントしています。 ログアウト / 変更 )

Google+ フォト

Google+ アカウントを使ってコメントしています。 ログアウト / 変更 )

%s と連携中