最近Amazon Alexa界隈で起きたこと(7/31〜8/31)

前回の記事から1ヶ月経って、Amazon Alexa界隈で何が起きたでしょうか。

目次


現時点のSkill数(US)

f:id:sparkgene:20170901221250p:plain

今月も約3000個のSkillが追加され、Skillの総数が2万件越えてきました。 昨年の10月からのSkillの増え方をグラフにするとこんな感じです。 去年の10月から5倍と、順調に増えていってますね!

f:id:sparkgene:20170902123809p:plain


AVSでDisplay Cardsを使ってマルチモーダルな体験の作り方

How to Build Multi-Modal Voice Experiences Using Display Cards for AVS : Alexa Blogs

この記事では、AVSを利用したデバイスでどうやってEcho Showで利用されているdisplay templateを使うかを簡単に解説しています。 AVSのサンプルソースでは、すでに受信したdisplay cardsの情報をjsonで吐いてくれるサンプルが含まれているそうなので、Echo Showの様な画面付きのデバイスを開発する際の参考になりそうです。


List Templateの正しい使い方

Designing Skills for Echo Show: Choosing the Right List Template : Alexa Blogs

前回は、Body Templateの使い所を説明していましたが、今回はListの使い方について解説しています。

List Template 1は垂直方向にアイテムを表示してくれるリストです。

  • 発話例の一覧
  • 銀行の取引履歴
  • 食材の一覧
  • 目次
  • タイムテーブル といった情報を表示するに適したレイアウトとなっています。

表示できるテキストは3ヶ所となっているので、食材名、分量、カロリーみたいなレイアウトで表示することが可能です。

List Template 2は水平方向にアイテムを表示してくれるリストです。 このリストでは画像が必須となるので、本、映画、ビデオといった、目で見て理解しやすい物を表示するのに適しています。 画像は正方形、縦長、横長といった種類の画像にも対応しています。

Qiitaの方にサンプルソースを解説しているので、実際にskillを作ってデベロッパーコンソールで表示を確認することができます。

qiita.com


良いスキルを作るデベロッパーはお金が稼げます

Developers Earn Money for Eligible Skills Customers Love : Alexa Blogs

前に、ゲーム、トリビアのカテゴリで評価の高いSkillを開発したデベロッパーには、Amazonからお金をもらえるというプログラムを開始しましたが、 今回のアナウンスで、対象となるカテゴリが増えました。

  • Education & Reference
  • Food & Drink
  • Health & Fitness
  • Lifestyle
  • Music & Audio
  • Productivity

噂によれば、DAU 10万ぐらいのSkillだと、$5,000位もらえるとか。


商用デバイスメーカー向けのAVS SDKの紹介

Introducing the Alexa Voice Service Device SDK for Commercial Device Makers : Alexa Blogs

今まで提供されていたサンプルはJavaベースでしたが、今回のはC++ベースのライブラリを提供してくれるものです。

SDKには、AVS APIを活用して、スピーチ認識や合成、ストリーミングメディア、タイマーとアラーム、通知、天気予報、数千のカスタムスキルなどのその他の機能を含む、Alexaのコア機能を処理するケーパビリティエージェントも含まれています。


Echo Show向けのSkillの審査で失敗しないためのTips

Tips for a Successful Echo Show Alexa Skills Certification : Alexa Blogs

  1. Alexaの喋る音量とSkillが利用する音声データの音量を合わせましょう

text-to-speechでAlexaが喋る音量と、skillで音声データや動画を利用する場合に、音量が極端に違うとユーザーはそのためにボリュームの調整が必要となり、非常にストレスです。 ガイドがあるので、参考にして調整しましょう。 https://developer.amazon.com/public/solutions/alexa/alexa-skills-kit/docs/normalizing-the-loudness-of-audio-content

  1. GUIの挙動を正しく組み込みましょう

実際に審査に上がってくるEcho Show向けのSkillで画面をタップしても正しい画面に遷移しなかったりする物があるようです。 正しく実装して、ユーザーが迷わずに操作できるようなUIを心がけましょう。

  1. 画面にはユーザーが読める文字だけ表示しましょう

既存のサービスで利用しているデータをそのまま利用すると、たまにHTMLタグが含まれていたり、記号など読めない文字が含まれていることがあるそうです。そのようなSkillだと、審査に落ちてしまうのでちゃんと確認しましょう。

  1. 著作権に気をつけましょう

Echo Showでは画像や動画など、外部から引っ張ってきて表示することが出来ます。しかし、Amazonではそれが無断で利用された著作物なのか、商標に該当するかまではわかりません。 もし、Skillでそのようなコンテンツを利用する場合は、利用を停止するか、そのコンテンツを利用する権利を持つことをAmazonに示す必要があります。

Amazon.com Help: Trademark Usage Guidelines


バイスメーカーにさらに新しい音楽体験を追加出来るようになりました

AVSに新たなる機能が追加されました。

  • Connected Speaker APIs
  • Multi-Room Music SDK

Connected Speaker APIs

バイスメーカがクラウドベースのサービスをAVSに接続できるようにします。 デバイスメーカーがこれに対応することによって、自分たちのスピーカーシステムをAlexaから操作できるようになります。

Multi-Room Music SDK

先日発表された新しい機能で、複数のEcho端末に対して音楽を再生させるというのが発表されました。

Alexa’s new music feature makes your speakers work like Sonos - CNET

このSDKを利用することで、デバイスメーカーがAlexa対応のスピーカーをグループ化されたAmazon Echoなど一緒に音楽を再生することが可能になります。


子供向けのSkillが開発できるようになりました

Alexa Now Supports Kid Skills : Alexa Blogs

13歳未満の子供に向けたSkillをリリースすることが出来るようになりました。 ユーザーがSkillを利用したい場合は、親による承認プロセスを経る必要があります。


あとがき

今月の後半は、色んなデバイスメーカーからAlexa対応のスマートスピーカが発表されました。

そして、最も興味深い話として、MicrosoftのCortanaとAmazon Alexaが相互に連携できるようになるという発表がありました。

gigazine.net

Google Homeと比べるとAlexaは曖昧なワードでの検索みたいな部分が弱かったですが、Cortanaの無効にあるBingと繋がれるようになれば、苦手だった部分が克服できます。 また、Cortanaからビジネス領域では絶大なるシェアを持つOffice 365と言った、部分にアクセスできるようになるので、toCだけではなくtoBの部分でも利用が考えられます。 もちろん、CortanaはAmazonのECだったりAmazon MusicやVideoと言ったエンターテイメントの部分とも連携できるようになるかもしれないので、どちらにとっても良い提携話だったのではないでしょうか。

こういった感じで、それぞれのプラットフォームの良さをお互いが補完できるように連携できると、ユーザーとしてはどんどん使いやすくなっていくので、大歓迎ですね。