SmartNewsのニュース選定のアルゴリズムってどうなってるの? 裏側を聞いてきた
「世界中の良質な情報を必要な人に送り届ける」というミッションを掲げるSmartNews。そんなSmartNewsに、良い情報を選ぶアルゴリズムの仕組みや専用チャンネルの広告収入還元などについてマーケティングディレクターの松岡氏に話を伺った。
「世界中の良質な情報を必要な人に送り届ける」そのアルゴリズムとは?
Q. SmartNewsのアプリはどんなコンセプトで始まったのでしょうか。
インターネット上にある「世界中の良質な情報を必要な人に送り届ける」ことがSmartNewsのミッションです。実は、SmartNewsの前身で、「Crowsnest(クロウズネスト)」というサービスがあります。このサービスは、Twitterをクロールして話題となっている情報をパーソナライズして届けることに特化していたものです。しかし、あまりユーザー数が伸びなかったこともあって、マスに向けて方向転換してできたのが、このSmartNewsのアプリです。
Q. SmartNewsが考える良質な情報の定義とはどんなものでしょうか。
良質な情報の定義をお話しするよりもまず、どういった仕組みでSmartNewsが情報を選択しているかこちらをご覧ください。
次のようなアルゴリズムでコンピュータが自動的に判断しています。順に説明します。
- SmartNewsで対象となる情報は、インターネット上で固有のURLについてユーザーが何らかのアクションを起こしているものです。
- その情報の内容がどの言語で記述されているかを判断します。
- その情報がどのカテゴリに属するか、カテゴリ分類します。
- その情報の類似判定をします。これは、多様性のある情報を届けるためで、同じような内容が重複しないようします。また、情報が重複している場合は、情報の早さや人によく見られているといったさまざまな要素を総合的に判断して一番良いと判断されるものを選定しています。
- さらに、そのなかで注目度判定を行います。注目度判定にもいろいろな指標がありますが、たとえば以下があります。
- ソーシャル上でどのくらい反応があるか
- SmartNewsで実際に配信したときのユーザーの反応
たとえば、SmartNewsで配信したときのユーザーの反応は、情報をタップしたのか、タップしたがすぐ戻ったのか、スクロールしてじっくり読んだのか、といったユーザー行動のフィードバックを受けて判断し、その集合知を話題のニュースとして抽出して配信しています。
現時点ではユーザー個別に最適化した情報を配信するようなパーソナライズは行っていません。ただし、SmartNewsとTwitterを連携して利用できる「Twitterチャンネル」や特定のメディアの情報を見られる「チャンネルプラス」では、上記で説明したものと同じロジックが適用されるので、結果的にパーソナライズされている部分もあると思います。
ユーザーが広がると、良いとされる基準も変わってくるし、好まれる情報も変わってくるので単純にコンピュータが判断するだけでなく、ユーザーの行動を反映させて良い情報とは何かを決めています。
Q. ソーシャルの反応とは何を基準に見ているのでしょうか。
たとえば、1時間前に出たニュースと5分前に出たニュースでは、1時間前のニュースの方がユーザーの反応が累積されていますが、SmartNewsではそういった数値の取り方ではなく、予測モデルを適用して判断しています。1時間前の情報や5分前の情報でも同じ基準で比較できるように補正をしてから判断しています。
人との会話でも「さっき知ったんだけど、すごいニュースが……」と話すことがあると思います。それはその人の経験から「現時点でこの情報は、価値が高い」と判断して話しているはずです。
SmartNewsでもそれと同じことができるように、毎日利用するユーザーのフィードバックを集めて、アルゴリズムを日々改良しています。
Q. 情報の正しさはどのように判断しているのでしょうか。
それもやはり、先ほどお伝えしたアルゴリズムでコンピュータが判断しています。より多くの人が反応したもの、ソーシャルでシェアされたものといったさまざまな要素を総合的に判断して、その集合知を配信しています。
ですので、人が情報の良しあしを判断するということは基本的にありません。そもそも対象とする情報量が多く、人が判断しきれる情報量ではありません。また、人が判断してしまうと、その人のバックグラウンドに影響されてしまう部分がありますので、コンピュータのほうがより中立的な情報をお届けできるのではないかと考えています。
スキマ時間のユーザーを増やす! UIの工夫とは?
Q. SmartNewsユーザーのペルソナなどは設計していますか。
対象ユーザーは全世界、モバイル端末を持つすべての人なので、ペルソナ設計はあまりしていませんが、ユーザーのアクセス行動はウォッチしています。
ニュースアプリ全体のアクセスのピークは、7時、12時、19時の3回です。これは各アプリが通知を送るタイミングということも大きく影響しています。しかし、SmartNewsは、この3つの時間帯に限らず、他の時間帯でも頻繁にアクセスされています。
アクセスがピークでないスキマ時間では、ゲームアプリやコミュニケーションアプリとともにSmartNewsを開いてもらえるように、情報の見せ方を工夫しています。
Q. どんな工夫をしているのでしょうか。
違い棚と呼ばれるUI(ユーザーインターフェース)を採用しています。このUIを採用している理由は効率的に情報を届けられるからです。たとえば、横一列で表示する情報量に比べて余白が少ない分、倍近くの情報を1画面で表示できます。
最適なUIを自動で判断できるように、記事の量、質、写真の有無などに応じてアルゴリズムが動いています。写真に関しても画質やユーザーの反応などさまざまな要素から判断して、良い写真だと判断されれば、拡大表示されるなどの仕組みが動いています。
Q. 最適な情報量はどのように決めているのでしょうか。
タイミングによって新しく出てくる記事の量も異なりますので、何本出ると決まっているわけでありません。カテゴリごとでも情報量のばらつきがあり、その時間にある一定以上の基準を満たした情報だけが配信されるようになっています。
Q. トップのチャンネルに表示される基準は。
トップの表示にも「多様性」アルゴリズムを入れています。たとえば、多様性のアルゴリズムを入れない場合、ユーザーの反応が良いトピックスだけが並んでしまい、エンタメの情報ばかりが並ぶことがあります。
しかし、これではユーザーのニーズに応えられません。ユーザーは自分の知らない情報を発見したいからニュースを見に来ているので、さまざまなカテゴリから情報が表示されるようになっています。ですので、単純なランキングで表示されているわけではありません。
Q. 「情報をパーソナライズしていない」と言っていましたが、実際にiOSとAndroidのユーザーで見比べたときに違ったのですがなぜですか。
その理由は、2つあります。
1つは、情報の取得時間です。いつアプリを開くかによって話題の記事は変わってくるので、アプリを開くタイミングが違えば表示が異なることもありえます。
もう1つは、OSの違いによって、ユーザーの動きも若干異なる場合があります。というのも、前述したようにユーザーの反応も1つの指標として配信する情報が決まるので、OSでユーザーの動向が違う場合は結果的に表示される記事も変わってくる可能性があります。
Q. 情報のカテゴライズはどのようにしているのですか。
コンピュータが自動的にアルゴリズムで判断しています。ただ、アルゴリズムも100%正確ではないので、カテゴリを間違えて表示している場合は、間違っていることを人が学習データとして整理し、機械学習の技術を使ってカテゴリの精度が上がるようにしています。
単純にそのカテゴリごとにキーワードを設定するといった手法ではなく、多面的かつ継続的に学習する仕組みが動いています。
さらなる良質な情報が生まれやすくすることもSmartNewsの役割
Q. アプリが登場したときは、サービス自体が合法なのか、違法なのかといった話がありましたが、現在どのような対応をとっているのか教えてください。
技術的には、検索エンジンなどと同じで、各WebページのURLへ逐次アクセスを行い、HTMLコンテンツやサムネイルを取得して見出しを表示し、アプリ内Webブラウザ上で当該記事のオリジナルURLを読み込みWebページを表示します。ユーザーが読み込み待機をしているときなどに「Smartモード」を選択すると、逐次アクセスにより取得していたHTMLコンテンツをSmartモード用のレイアウトに変換したうえで表示します。
また、技術面だけでなくコンテンツを提供していただくパブリッシャーの方にメリットがあるかどうか、という観点も重要です。結果的にメリットをパブリッシャーにもお返しできる形で、きちんとコンテンツを流通させられるか、といったところをどれだけ担保できるかを重要視しています。ですので、トラフィックだけでなく、記事ごとの反応を確認できるようなツールも用意し、より良い記事つくりに役立てもらったり、広告収益としてお返したり、という取り組みを進めています。
最近では、SmartNewsの広告収入を還元できるプログラムを開始していて、媒体社のマネタイズに貢献できるようにしています。
Q. では、それが専用チャンネル(チャンネルプラス)に展開されていくということですか。
はい、そうですね。いまチャンネルプラスが約80あるのですが、広告を入れる場合、基本的に広告収入の40%を媒体社にお返しするような仕組みにしています。すでに複数のチャンネルプラスでその取り組みが始まっています。
Q. フィードバックをお返しするとは、どんなことをされているのでしょうか。
チャンネルプラスを開設してもらっているパートナーには、ユーザーの各種活動状況を統計情報として閲覧できるログ管理サービスを通じて、チャンネル登録数や記事PV数などをフィードバックしています。
コンテンツの作り手にとって有益となる情報、たとえば、この時間にコンテンツをアップするとユーザーはどんな反応をするのか、同じ話題でも切り口によってユーザーの反応がどのように異なるのか、といった次回の記事つくりに活かせるような情報を提供しています。
コンテンツの作り手にとって良いフィードバックを提供する、そうすると良いコンテンツができてくる、SmartNewsはそのなかで良い情報を抽出する、このサイクルを循環させることでユーザーにお届けする情報もレベルアップできればと考えています。
日本国内の月間のアクティブユーザー数が400万以上ありますので、メディアの方にはSmartNewsは1つの実験の場だと思っていただいて、上手に付き合っていただければと思っています。
Q. トラフィックを返すとは具体的にどんなことでしょうか。
SmartNewsでは、アルゴリズムに基づいた情報の選定、選定した情報のタイトルを最適に見せるという部分を担っています。ユーザーが記事をタップするとその掲載元のメディアを直接閲覧し、さらに関連記事も見る、といった形でトラフィックを増加させます。Smartモードでもメディアが指定する広告を入れることができます。得られた広告収入は、当然メディアの収入となります。つまりコンテンツ自体を見る際に得られる収入はすべてメディアに還元される仕組みになっています。
ユーザーが「だまされた」と感じる広告は出さない!
Q. そんなに還元ばかりしていたら、全然儲からないのでは? 収益モデルはどんなものがあるのですか。
現時点では広告モデルです。広告基準はかなり厳しく設定していますが、やはりユーザーが「だまされた」と感じるような広告を掲載していると、結局SmartNewsというプロダクト自体の信頼性が下がってしまい、ユーザーがどんどん離れてしまいます。
ですので、広告表示はもちろん、医薬品法(旧薬事法)の表記や景表法などクリエイティブ、ランディングページなどかなり細かい基準を設けてチェックしています。JIAAで出されたネイティブ広告の基準も速やかに準拠し、さらに精度を高めていきます。
しっかりと基準を設けて、ユーザーだけでなく、広告を出稿する広告主も安心して出稿できるということを目指しています。
Q. ちなみに、広告審査も機械化されているのですか。
現時点ではさすがに人です(笑)。ですが、広告審査を通った広告がより適切なユーザーに届くようにするための仕組みなどは、かなりテクノロジーが駆使されています。
SmartNewsではユーザーがどんなニュースをよく見ているのかといった行動ベースの情報がわかっているので、広告主とそれを必要としているユーザーがうまくマッチングできるようにしていきたいと思っています。
広告自体が昨年12月に始まったばかりなので、これからですね。
Q. 今後の展望を教えください。
最初に述べたミッション通りですが、「世界中の良質な情報を必要な人に送り届ける」ために、世界中のユーザーにも満足してもらえるアプリにしていきたいです。ニュースアプリなのであまり言語を問わないサービスではありますが、地域特性、たとえばタイムゾーンの違いやメディアの好み、カテゴリの違いなどに対応していく必要があります。これは技術だけでなく、メディアとのパートナー関係をいかに円滑に構築していくか、という観点も非常に重要です。
世界中のユーザーに満足してもらえるために、プロダクトをよりよいものにしていく、というのが今までも、これからも最大の課題ですね。
ソーシャルもやってます!