ダンボーEcho制作メモ
GWの工作ということで、Raspberry Pi Zeroを手に入れたから、前からやってみたかったダンボーEchoを作ってみました。
Raspberry Piで自作のEchoを作る方法は、JAWSDAYS 2017でAlexaハンズオンを一緒にやったharuharuharubyさんの資料が分かりやすいので参考にしました。 qiita.com 資料との違いは、pyenvを利用しないでそのままインストールされているpythonを利用したのと、OSはGUIは使わないので「RASPBIAN JESSIE LITE」を使っています。 LITEを使っているのでSDカードは4Gでも容量的に問題はありません。
使ったダンボーはAmazon限定の箱仕様。 amzn.asia
顔の横にスイッチがあって、目に内蔵されているLEDが点灯します。
これをバラして、頭の中にRaspberry Pi Zeroを突っ込んで、自作Echoに改造します。
サイズがギリギリ入らないぐらいなので、使わないカメラ用のコネクタを限界まで削りました。
ウェイクワードに反応したら目のLEDで分かるようにしようと思ったので、配線とGPIOのテストをしてLEDがプログラムから光るのを確認。
LEDとラズパイの配線はこんな感じでやってます。
目を元の位置に戻して、ラズパイを後頭部の内側にネジ止めでしました。
首にあたる部分はラズパイを少しはみ出る形で固定しているため(コネクタ挿せるように)、少し加工しないと入りません。
後頭部部分を7mmぐらい切って、元々ボタン電池が入っていた部分もラズパイに干渉するので切ります。
無事完成したので、ラズパイ3で使っていたマイクとスピーカーで試すと、マイクは大丈夫だけどスピーカーの出力が全然足りなくて、音がかすかにしか聞こえない。
そんなわけで、USBスピーカーを新しく買って、USBハブにUSBマイクを刺して完成です。
デモ動画
入力待機中は右目だけ光って、ウェイクワードに反応すると左目が光ります。 元々のソースではウェイクワードに反応すると「ピン!」って音がなるのですが、視覚的に分かるようになるとより使いやすいと思います。
GPIOを利用したソースはこちら
あとがき
前に作ったラズパイ2の自作Echoと違って、ダンボーが喋ってくれるので何か癒やされますね。
次はソラコムに対応して、持ち運べるダンボーEchoにしたいところですが、そろそろUSBの出力が足りなくなりそうな気がしなくもないです。。
最近Amazon Alexa界隈で起きたこと(3/31〜4/30)
前回の記事から1ヶ月経って、Amazon Alexa界隈で何が起きたでしょうか。
今月は新機能が色々と発表されたので、それらを中心に紹介していこうと思います。
目次
現時点のSkill数(US)
毎月、約1,000個ずつ増えているので、もうすぐ、13,000を超えそうですね。 ゲーム・トリビア、ニュース関連のSkillだけで5000を超えています。
[4/5] Leverage the New Metrics Dashboard to Deepen Skill Engagement, Drive Retention
Leverage the New Metrics Dashboard to Deepen Skill Engagement, Drive Retention : Alexa Blogs
Alexa Skillののデベロッパーコンソールに新しくMetrics Dashbordが追加されました。 詳しくはqiitaに書いたのでそちらを参考にしてもらえれば。
[4/5] Build More Engaging Skills with Device Address API and Gain Insights with the New Metrics Dashboard
Device Address APIと言うものが追加されました。 今までAlexaでユーザの位置情報を取得しようとしても、Alexa Appで登録できる郵便番号しか存在しませんでした。(アカウント連携を利用する方法を除いて) 今回追加された機能は、Alexa AppでEchoデバイスに住所を登録でき、これをSkill側から取得できるというものです。(パーミッションの許可は必要) これにより、Uberを呼ぶとかDominoピザを注文するといったSkillがあったとした場合、ユーザーに別途位置情報を入力させること無く、配車したり配達することが可能になります。 詳しくはqiitaに書いたのでそちらを参考にしてもらえれば。
[4/6] Look Under the Hood with Echosim’s New Developer Console
Look Under the Hood with Echosim’s New Developer Console : Alexa Blogs
Alexaの新機能というよりも、Skillの開発ではかかすことが出来ない Echosim.io が、AVSでやり取りしている情報を見れる様に、デベロッパーコンソールが追加されました。
AlexaでAudioデータを再生させたいときなど、今までだと実際にどのURLにアクセスしに行っているか分かりづらかったですが、これらのAVSとやり取りしているJSONデータが見れるので、デバッグがすごくやりやすくなりました。
[4/7] Daylight or Incandescent? Announcing Tunable Lighting Control for Smart Home Skills
Daylight or Incandescent? Announcing Tunable Lighting Control for Smart Home Skills : Alexa Blogs
Smart Home Skillに新しいメッセージが追加されました。
今まではphilips Hueなどの電球は、Sceneの指定で照明の色を変えることが出来ましたが、これは事前にHue側でSceneを登録しておく必要があります。
今回追加されたメッセージでは、 Alexa, set the living light to blue
とEchoに話しかけると、以下のようなリクエストがSkillに送られてくるので、この情報を元に電球の色を変えるというものです。
{ "header": { "payloadVersion": "2", "namespace": "Alexa.ConnectedHome.Control", "name": "SetColorRequest", "messageId": "aaaaaaaaa" }, "payload": { "color": { "hue": 240.0, "saturation": 1.0, "brightness": 1.0 }, "appliance": { "additionalApplianceDetails": {}, "applianceId": "my-living-light" }, "accessToken": "zzzzzzzzz" } }
色は、hue(色相)、saturation(彩度)、brightness(輝度)で表されますので、デバイス側がRGBにしか対応していない場合は変換する必要があります。
試しに色を midnight blue
で指定してみると、HSBは以下の様になりました。
"color": { "hue": 240.0, "saturation": 0.7768, "brightness": 0.4392 }
他には、
- SetColorTemperatureRequest
- IncrementColorTemperatureRequest
- DecrementColorTemperatureRequest
が追加されており、 明るくして
とか、 涼しい感じ
みたいに話しかけることで色合いを変更できるようです。
ちなみに、存在しない色(適当な言葉)を指定すると、Skillを呼び出さずに失敗するみたいです。
最近家で映画を見たりする時は、Hueで照明をいい感じにすることが多いので、DVDが映画に合う色をAlexaに教えてくれると、面白いかもしれないですね。
[4/18] Improve Skill Quality with the New Beta Testing Tool for Alexa Skills (Beta)
Improve Skill Quality with the New Beta Testing Tool for Alexa Skills (Beta) : Alexa Blogs
Skillを一般公開する前に、βテストを行いたい時があるかと思いますが、これはそのための機能です。
特徴としては
- 最大2,000名を招待できる
- βテスト期間は90日
- メールを送ることで招待可能
- フィードバックをもらうことが可能
今までも、他の開発者にまだ公開していない自分のSkillを利用可能にする事はできましたが、これはどちらかと言うと数名での開発時の共有みたいな物で、今回のは一般のユーザーを招待することが出来ます。
[4/18] Announcing New Alexa Skill Builder (Beta), a Tool for Creating Skills
Announcing New Alexa Skill Builder (Beta), a Tool for Creating Skills : Alexa Blogs
Interaction Modelの設定がGUIを使ってIntent Schema、Custom Slot、Sample Utterancesが開発できるようになりました。 ちょっと使った感じだと、直感的になった印象です。IntentとSample Utterancesがわかりやすく連携していたりとするので、初めて作る場合はこのGUI使うと分かりやすいのではないかと思います。 また、以前に追加された Built-in Intent Library の指定が検索&チェック付けるだけで追加できたりするので便利そうです。 (ただ、開発する側からすると、APIでJSONを簡単に登録できたりする方が、CIと連携できて便利なんじゃないかな〜と思うので、速く全部API化してくれないかなと)
[4/21] グーグル・ホーム、複数ユーザー対応、個人を識別する音声認識機能を追加
Alexaで欲しかった機能がGoogle Homeで先に実装されてしまいました。 先日、バーガーキングのCMでGoogle Homeを一斉に起動させるって事案がありましたが、すぐにCMに反応させないように改修が行われたそうです。声紋識別ができれば簡単にできる物なので、Googleさんとしてはちょうどいいタイミングだったのかなと思ったり、もしかするとバーガーキングとGoogleが裏で共謀してたとかあるのかな。どちらも話題になったので、マーケティングとしては成功だったりしてとか、想像してしまいます。
[4/26] Echo Look発売
$200という低価格でAlexa、深度を検出できるカメラ、動画撮影ができる新しいEchoが登場しました。 動画ではファッションのアシスタント的な位置づけみたいで、機械学習で自分が似合う洋服を選んでくれたりと、今までのスピーカーとは違う立ち位置のEchoとなっています。 Amazonが出してきたということで、将来的には洋服の購入に結びつける機能が今後追加されてきそうです。 Lookの登場でスピーカーにとらわれない、音声UIを搭載した家電の可能性を更に広げることになるのではないかと思います。
[4/26] Voice-enabling Your Home and Devices with Amazon Alexa and AWS IoT
https://www.slideshare.net/AmazonWebServices/voiceenabling-your-home-and-devices-with-amazon-alexa-and-aws-iot-level-200www.slideshare.net
AWS Summit Sydneyで行われたAlexaのセッションで、AWS IoTとSkillを連携させて家電を操作しようという内容です。 ガレージのドアを(海外らしいなというイメージ)AlexaのSmart Home SkillとAWS IoTを連携する方法について解説しています。
前にRaspberry Piを学習リモコンにして操作する物も作ったことがあるので、こうやって家をどんどんスマートホーム化するのは今後も増えていくかなと思います。
[4/27] New SSML Features Give Alexa a Wider Range of Natural Expression
New SSML Features Give Alexa a Wider Range of Natural Expression : Alexa Blogs
Alexaで利用できるSSMLに新しい機能が増えました
- Whispers
- ヒソヒソ声みたいに喋らせる
- Expletive beeps
- 途中から「ピー」って音を出して発話を隠すような効果(Fワードとか消すのに良いのかな)
- Sub
<sub alias="aluminum">Al</sub>
のように書くと、ALという略語に対して、aluminum
と発話してくれる
- Emphasis
- 発話を部分的に強調したいときに音量を上げてゆっくり喋らせたり、音量を下げて早く喋らせるといった効果
- Prosody
- 音量、ピッチ、レートを変更できる。(これ使えばEmphasisを実現できそうだけど、Emphasisはすでに3種類のパターンが用意されているもの)
Webから拾ってきたような普通のテキストをそのままAlexaに渡して喋らせることは可能ですが、意外と聞きづらかったりする問題が有ります。 今後、音声UIが主流となっていく場合、SSMLを使ってテキストをより自然な形で発話できるようにするのは大事だなと思っています。こういったテキストを自動的にSSMLに変換してくれるようなサービスも今後増えてきそうですね。
あとがき
色々と機能が追加されてきてますね。流石に1万Skill越えただけあって、開発者の声を色々と反映しているって感じでしょうか。 また、AWSと同じで新しい機能は最初から全部の言語で利用可能!って感じでもないので、日本語対応したときにどこまでの機能が使えるかも気になりますね。早く日本に来ないかな〜。
BMW 116i Sports
都内だと車がなくてもそれほど不自由はしないってことで、車を買う予定はまったくなかったのだけど。。
年末に知り合いから車を預かって半月ぐらい車のある生活をおくったら、車無しの生活に戻るのはしんどいと思うようになってしまった。
な訳で、20年ぶりに車を買った。
ちなみに、前に乗っていたのは日産の180SX。
そこで、買うなら3年前に欲しいなと思って、試乗もしてみたけど、なんだかんだで400万するので流石に無理と思って買わなかったのがBMW 116i。
3年経って、118iとして新型が出た今のタイミングがちょうどよかったのか、中古市場には結構な数が出回っていた。
ネットで1日ぐらい探して良さそうなのを数台持っている外車専門みたいな中古屋を見つけたので、翌日は実車を見に行きました。
目をつけていた車体はちょうど売れてしまった後で残念と思いつつ、他の車体を見ていったら、3年落ち走行距離4,500km、傷無しな車体を見つけた。
全然走っていないってこともあり、車内も新品同様。車検が切れていたので試乗はできなかったけど、エンジンかけてみると調子は良さそう。
家に帰って、嫁を口説いて、お店に電話して仮押さえ。
翌日は嫁も一緒に見に行って、購入決定。(他の客も買いたいとその日来てたけど、仮押さえしておいてよかった)
探し始めてハンコを押すまで3日という短期間での購入でしたが、すごくいい車体と出会えたと思う。
お金持ちの娘の車(想像)だったからか、オプションはほしいのはだいたい付いてるのにもかかわらず、新車の半分以下の値段。
聞けば、BMWは新車でも結構値引きするから中古の値段は結構安いらしい。
コーナーポール付きの車に乗るとは思わなかったが、116iは前が見えなくて怖いからあまり気が進まないと言う嫁の心を動かすには必要なアイテムだったのでしょうがない。
4ヶ月ぐらいで1,500km走った。平日は乗らないことを考えると、前のオーナーはよっぽど乗らなかったんだなと。
116iは8速ATなので、街乗りしている時は、シフトアップしている感があまりない。 コンフォートモードだと2,000回転ぐらいでシフトアップしていくので、加速は非力な感が凄いけど、スポーツモードにして加速すると、さすがテンロクのターボって加速をしてくれるので、山道や高速でも気持ちよく走ることができる。
ハッチバックなのでラゲージスペースも広く、荷物は結構載る。 リアシートも倒れるので、大きめの荷物も載せることが出来、使い勝手はかなり良いと思う。
最近Amazon Alexa界隈で起きたこと(3/1〜3/30)
前回の記事から1ヶ月経って、Amazon Alexa界隈で何が起きたでしょうか。
今月も引き続きAlexaの話題がいっぱいあった月でした。 日本語の記事もいっぱいでているので、今回はAlexaのBlogを中心に紹介していこうと思います。
目次
現時点のSkill数(US)
一月で1000個以上Skillが増えました。順調にSkillの数が増えていますね。 これだけ増えてくると、どうやって自分のSkillを知ってもらうかとか、繰り返し使ってもらえるかとかが一つの課題になってきそうですね。
[3/3] Announcing Lock Control and Query for Smart Home Skills
Announcing Lock Control and Query for Smart Home Skills : Amazon Developer Blogs
Smart Home Skillにドアロック関連のAPIが追加されました。(USのみのサポートです)
- GetLockStateRequest
Alexa, is lock name locked/unlocked?
で施錠の状態を聞くことが出来ます
- SetLockStateRequest
Alexa, lock the lock name
でカギをかけることが可能
残念ながら、鍵の解錠は出来ません。 元々Skillは家のセキュリティーをいじるようなのは禁止されていたのですが、今回のAPIでもカギをかけることは出来ても、開けることは出来ないのでセキュリティーを担保したということなのかもしれませんね。
[3/7] Learn How to Build Voice-Enabled Devices with Amazon Alexa
Webinar: Learn How to Build Voice-Enabled Devices with Amazon Alexa : Amazon Developer Blogs
AVSについての説明をしてくれています。 Alexaを搭載したデバイスを開発しようと思っているなら、一度は見ておくと良いと思います。 そして、raspberry piを使って実際に作ってみようと思ったら、re:Invent 2016の自作Echoのワークショップが分かりやすいので、これを参考に実機を作ってみるのがいいでしょう。
[3/8] Logitech ZeroTouch Brings Voice Control and Amazon Alexa to Any Car
Logitech ZeroTouch Brings Voice Control and Amazon Alexa to Any Car : Amazon Developer Blogs
マウントみたいのがAlexaを搭載しているのではなく、AlexaのクライアントアプリがAndroid向けに用意されています。 マウントにAndroidのスマフォをくっつけると自動でZeroTouch appを起動します。そして、手をスマフォの近接センサー(電話するときに耳に当てると反応するやつ)にかざすと、コマンドの入力待ち状態になります。 車にAlexaを搭載するとなった場合、データ通信が課題になりそうですが、スマフォであれば通信環境もあるし、車以外でも使えそうだし、便利そうですね。
[3/11] JAWSDAYS 2017 Alexaハンズオン
JAWSDAYSでAlexa三昧のセッションを担当してきました。 ラズパイを使った自作Echoの作成から、Alexa Skill Kitを使ってSkillを作るハンズオンを一日掛けて開催しました。 全部で、150名ぐらいの人が参加する人気のセッションとなりました。
[3/15] Amazon Makes it Free for Developers to Build and Host Most Alexa Skills Using AWS
AmazonがSkillを開発し公開しているデベロッパーに対して、AlexaのSkillを運用するに発生するAWS料金に対して、最大で毎月$100分のクレジットをAWSのアカウントに振り込んでくれるというすごい話。 かんたんなSkillであればLambdaだけで完結するのでほとんど運用コストはかからないけど、DynamoDBとかその他のマネージドサービスを利用する場合は、それなりの費用がかかってしまうので、これはすごくありがたい話じゃないでしょうか。
[3/16] Amazon and Makers Academy Announce New Alexa Training for Ruby Developers
Amazon and Makers Academy Announce New Alexa Training for Ruby Developers : Amazon Developer Blogs
Makers Academyというオンラインの学習サービスで、rubyを使ってのSkill開発講座を公開しましたという話。運営元はUKがベースなので、 Cloud Guruというオンラインの学習サービスでもAlexaの講座があるので、初めてでわからないという場合は、こういったサービスを使ってみるのもいいかもしれないですね。
[3/16] Tips for a Successful Alexa Skill Certification
Tips for a Successful Alexa Skill Certification : Amazon Developer Blogs
Skillのcertificationをすスムーズに進めるための秘訣という内容が公開されました。 1万ものSkillがcertificationを通ってきたわけですが、そのうちの65%が以下のような要件を満たせずに指摘されているとのことで、今一度Certification Requirements for Custom Skillsを読んでねってことでしょうか。
- Example phrases
- Invocation names
- IP infringement
- Session management
- Help intent
前にSkillを申請した際に指摘された内容をqiitaにあげているので、興味があればそちらも参考にしてみて下さい。
[3/17] Build an Alexa Quiz Game Skill Using Our New Template
Technical Tutorial: Build an Alexa Quiz Game Skill Using Our New Template : Amazon Developer Blogs
クイズゲームのSkillを作るためのテンプレートが公開されました。 定期的にこういったテンプレートが提供されるので、初めて作る人もサンプルを見ながら作れるので非常に分かりやすいかなと思います。 簡単に作ることはできるのですが、ゲームのSkillは大量にあるので実際に人に使ってもらう為にはどうやってプロモーションしていくかが今後の課題になっていくのかなと思います。 AppStoreの頃のように、そう言ったSkillの紹介サイトみたいのが今後増えていく可能性がありますね。
[3/22] Huawei Updates Mate 9 with Amazon Alexa-Integrated Mobile App
Huawei Updates Mate 9 with Amazon Alexa-Integrated Mobile App : Amazon Developer Blogs
HuaweiがリリースしているMate 9と言うスマフォに、OSのアップデートでAlexaのアプリをプリインストールアプリとして導入しました。 すごいですね、アップデートしたらスマフォにAlexaが標準装備されるなんて。
あとがき
Mate 9やFordなど海外ではドンドン実機に組み込まれていきますね。 その一方で、LineがClovaというAIアシスタントを発表し、日本語対応するとも言っています。
国内ではLineを使っているユーザーを取り込むって流れも作れそうなので、Alexaの日本対応よりも先に出てくると、シェアがどうなってしまうか気になりますね。 ぜひAmazonには頑張ってもらって、Alexaの国内展開をしてほしいです。
最近Amazon Alexa界隈で起きたこと(1/30〜2/28)
前回の記事から1ヶ月経って、Amazon Alexa界隈で何が起きたでしょうか。
今年に入ってからAlexa関連の日本語記事が一気に増えてきたように感じます。CESですごく話題になったので、それで一気に広がってきた感じですかね。 そんなわけで、今回は国内の記事を中心に紹介していこうと思います。
目次
現時点のSkill数(US)
ついにSkill数が1万を超えました!!
[1/31] Starbucks、iOSアプリとAmazon Alexaでの音声オーダーを可能に
Alexaを介してスターバックスでいつも飲んでいるコーヒーを注文できるようになるみたいです。(先行ユーザーはもう利用できるとか)
[2/1] やって覚えるAmazon Alexa
クラスメソッド株式会社のブログでAlexaの連載がスタートしています! 非常にわかり易い内容で、さすがのクオリティーという感じです。ゼロから始める場合は、この連載を読むだけでかなり理解できるのではないかと思います。
[2/6] みずほフィナンシャルグループがAPIを中心に展開するFinTech最新事例――Amazon Echo、Soracom、LINE、Facebook、マネーフォワード、freee (½)
記事の中ではあまり書かれていないですが、みずほは去年シリコンバレーでAmazon Echoを使った実験を行っていました。 シリコンバレーでAI活用の実証実験--みずほ銀行がISID、NRIと連携 - ZDNet Japan 実際にスマフォのアプリとAlexaを連携して、残高照会ができるSkillを作ったりしたそうです。
このように国内でも実際にSkillを作成している会社も出てきており、WordPressのホスティングサービスであるAMIMOTOを提供しているDigital Cube社は、かなり初期の頃からAlexaを使って商品の説明をするAMIMOTO Ninjaをリリースしています。
WordCamp EU 2016にAlexa AMIMOTO Ninja参上! | 超高速 WordPress AMI AMIMOTO
Alexaはまだ日本語には対応していませんが、早い段階から触っている会社は実際にAlexaが日本に来た時に、大きなアドバンテージを持つことになるかなと思います。
[2/7] Amazon、音声アシスタント「Alexa」の言語サービスを英国とドイツに拡大
Amazon EchoやAlexa Skills Kitはすでにイギリスとドイツに対応していますが、音声認識部分であるAlexa Voice Serviceはまだ対応していませんでした。しかし、AVSもいよいよイギリス、ドイツ語に対応することとなりました。
さっそく、ブラウザでAVSが利用できるechosimもすでに対応しています。
AVSがイギリス、ドイツ語に対応したわけですが、実はまだ対応していいない機能(kindleの読み上げとか)もあります。
Alexa Voice Service for the United Kingdom and Germany
日本に入ってくるときもこんな感じで段階的に入ってくるのかな?
[2/17] Google Homeで、Amazon Alexaのように音声ショッピングができるようになった
Google Homeでも喋ることで買い物ができるようになったとのことです。 Amazon Freshに似たサービスである、Google Expressを利用して買い物ができるようで、Amazonとの戦いが激しくなってきた感がありますね。Amazon FreshもGoogle Expressも、まだ日本では提供されていないサービスなので、国内だと先に対応したほうが意外ヒットするかもしれないですね。
[2/17] Amazon Echoは 「ショッピング向きではない」と語るベゾスの発言は “今のところ” たぶん正しい
前に出た記事だと、Echoは音楽の再生に適していると語りましたが、今回は買い物に適さないとという話。 確かに、明確に商品が決まっている状態では、「〜〜を買って」って買えますが、実際に「iPhoneの充電ケーブルを買いたい」といったシチュエーションでは、見た目や、値段など幾つかの選択肢から実際に買うものを選ぶ事が多いと思います。 音声だけでは、いくつも出てくるような選択肢の中からほしいものを選ぶのは、なかなか難しいです。ブラウザなら、気に入ったものを別のタブで開いておいたり、ブラウザバックでさっきのページに戻って商品を見るといったことがやりやすいですが、これを音声のみでやるのはしんどいですね。 そこで、ディスプレイも持ったAlexaが出てくると、そのあたりのUIの問題も改善されそうなので、早いとこディスプレイ付きのEchoが出てこないかな〜と思います。
[2/21] Amazonショッピングアプリが「音声検索」の提供を開始――ブランド名やカテゴリ名、複数キーワードにも対応
Amazonのアプリが音声による検索に対応したそうです。 実際に使ってみると、「ドラえもん」とか一般的というか、名詞だったり分かりやすい単語は高い精度で認識してくれますが、「海底鬼岩城」みたいな一般的ではないような単語だと「快適頑丈」と認識されてしまい、日本語の難しさが出ているかなという印象。 しかし、Amazon Pollyのtext to speechもあるし、このように音声認識の機能も出てきたということで、Alexaの日本語対応が少しづつ進んでいるのではないかと、非常に楽しみになってきますね。
[2/21] 最新世代のFire TV Stickが国内で販売
https://www.amazon.co.jp/dp/B01ETRGGYI/
アメリカで販売されているこの世代のFire TVはAlexaに対応しています。リモコンに向かって「Alexa,〜〜」って話しかけると、テレビの画面にカードが表示されます。 Amazon Tapがアップデートでウェイクワードに対応したということを考えると、Alexaが日本語対応したらこのFire TVもアップデートでAlexaの利用がenableになり、使えるようになるんじゃないかと期待してしまいますね! なので、さっそく購入予約しておきました。
[2/24] 一周回ってイエ電復活。Google HomeとAmazon Echoに通話機能が追加されるかも
どうなんだろう。。 一人暮らしなら気にならないかもしれないが、要は電話を常にスピーカーモードにして喋るってことになるので、実際に対応したとしてもそんなにニーズはあるのかな?と思ってしまう。
[2/25] Amazon Alexaのスキルが1万を突破ーー人気トップ10のスキルとは?
いよいよスキル数が1万を超えましたね! 日本に導入されたら、どんなSkillが人気になるか気になりますね。 Dittyあたりは、日本語版がでても人気がありそうですね。 今日はなんの日?みたいなのも人気が出そうです。 3番目のNick Schwabさんが作成した環境音のも聞いたことありますが、癒やし感があっていいですね。 Nick SchwabさんはAlexaのSlackでもよく発言しているのを見かけます。
[2/27] 音声アシスタント「Alexa」が注目を浴びる理由とは?
「Amazonが音声認識におけるOSとでも呼ぶべきプラットフォームを完成させつつある」この通りかなと思います。 国内でどんなふうに流行るかはわかりませんが、海外のようにスマートホームのインターフェイスとしての利用を促進するかもしれないですね。 今のスマートホームはアプリを操作する方法が多いですが、正直それなら壁のスイッチ押したほうが早い。音声での操作はすごく自然なので、個人的には期待しています。
[2/27] 音声認識の覇権を握る「Amazon Alexa」、逆転の余地はまだある?
記事にかかれているオフラインの処理はものすごく欲しい機能ですね。 AVSがローカルのコマンドを叩ける様になると、ネットワークを経由しなくても良くなるので、これは欲しいです。 lambdaがエッジに対応したので、Alexaがそのエッジファンクションを呼べるようになったら、色々と解決するのかもしれない。
あとがき
今回は日本語の記事多めで紹介しました。 Alexa関連をブログに書き始めた数ヶ月前とは比べ物にならないぐらい、日本でもニュースで見かけるようになりました。 あとは、実際に日本に来るのを待つだけですね。
最近Amazon Alexa界隈で起きたこと(12/31〜1/29)
前回の記事から1ヶ月経って、Amazon Alexa界隈で何が起きたでしょうか。
目次
現時点のSkill数(US)
前回は1500ぐらい増えてたのが、今回は1700ぐらい増えてます。Skillの増えるペースが上がってきた印象です。2月の前半にはいよいよ1万を超えそうですね。
Alexaで使えるコマンドが色々増えている
今までAlexaはWikipediaのSkillを介して質問したりは出来たのですが、Google Homeのように適当な質問を投げかけても答えてくれませんでした。 何時からかはわからないですが、Alexaもいつの間にかこのように適当な質問をしても、いろいろな種類の質問に応えられるようになりました。 この機能は今までGoogle Homeにすごく劣っている部分でしたが、このアップデートで改善されました。
[1/5 - 7] CES 2017が開催
今年のCESではAlexa搭載の家電が大量に出品され話題となりました。 CES期間中に700ものAlexa搭載デバイスが登場したという話もあり、車から冷蔵庫など幅広く組み込まれました。
個人的にAlexaが組み込まれると便利だと思うものは、車のように見ないで何か操作したいものや、音声で操作しながら結果を画面で見れるようなものなので、車やテレビへの組み込みはすごく良いと思いますし、欲しいですね。 冷蔵庫にAlexaってのも一瞬おや?って思うかもしれませんが、在庫を見ながらその場で注文できたり、Amazon DRSと組み合わせることで更に自動化出来ますね。
この記事の中ではAlexaの利用状況が紹介されていますが、Alexaのユーザーの約1/3は商品の購入をAlexa経由で行っているようで、もう珍しい音声認識デバイスが音楽を流すみたいな状況から、日常の生活で利用するUIとなっているのが分かります。
Alexa側からのCESのまとめ記事はこちらになります
CES Recap: What Amazon Alexa Was Up to in Las Vegas : Amazon Developer Blogs
[1/6] オンキョーからAlexa搭載スピーカーをCESに出品すると発表
http://www.jp.onkyo.com/news/information/topics/20170106_PR_SmartSP.pdf
国内のメーカからAlexa搭載デバイスが!! 発売時期は未定ですが、本家のAmazon Echoより早く発売されたら、盛り上がりそう。とは言え、国内で販売しても日本語対応は別の話なので、Amazonはよ。
[1/6] Display Cards for Alexa: A New Complementary Feature for Screen-Based Products
CES関連の記事が多いので割愛していたのですが、この記事は紹介したいと思います。
以前にNucleusが発表したスマートインターフォンを紹介しましたが、そのインターフォンがAlexaのカードを表示するというアップデートがされていました。 カードは今までAlexa Appで確認することが出来ましたが、このようにサードパーティのデバイスで見れるのは今まであまりなかったかなと思います。 というのも、今まではAVS側からSkillが返したカードの情報を取る方法がなかったと思うのですが、一部のハードウエアメーカに対して先行してこの機能を提供してもらえるようです。 カードの先行利用申請
AVSが動くデバイス側でカードを表示できるようになると、音声で操作しながら結果を表示できるので、UXは劇的に良くなると思います。だって、Alexaが10種類ぐらいの選択肢を質問してきても、全部聞いた頃には最初のを忘れちゃいますよね。そのためには、画面があるとすごく便利になるはずです。
[1/10] Tips for Using Cards with Your Alexa Skill
Tips for Using Cards with Your Alexa Skill : Amazon Developer Blogs
カード関連で、どうすればユーザフレンドリーなカードを作れるかという話。
- カードにSSMLを含めるとそのまま表示されるから専用に整形する必要がある
- 自分に所有権がない画像は使わない
- 読みやすいように適度な改行を含めて整形する
- Alexa Appは過去のカードを全部見れるわけではないので、過去のを見る必要があるような実装はしない
[1/15] The 2017 Voice Report by VoiceLabs
google analyticsのような機能 VoiceInsightsを提供しているVoiceLabsから最近の音声UIデバイスの利用状況についてのレポートが発表されました。
日本語でまとめたわかりやすい記事も出ています。
米国のAI音声アシスタント、販売数・スキル数が大幅増加中、しかし・・・利用度合いは低い | ロボスタ - ロボット情報WEBマガジン
Skillに関しての課題は記事にかかれていますが、同じ印象を受けます。iPhoneのAppStoreが登場した時も同じような現象が起きていたことを考えると、これからキラーSkillが登場し、本当にユーザーが日々利用したいと思えるようなSkillが登場してくるのではないでしょうか。
ちなみに、Voice Experience Analytics は私が作ったSkillでも利用しているので、使い方をqiitaに上げておきました。
[1/21] (個人ネタ)Amazon AlexaとPhilips Hueを連携させる
実際にHueのAlexa対応キットを買って家に設置してみました。 音声で操作できるのは便利ですね。Hueは照明の明暗や色を調整できるので、Scene(Smart Home Skillの機能)を声で切り替えると部屋の雰囲気が変わるのはちょっと感動。
[1/25] Why a Custom Slot is the Literal Solution
Why a Custom Slot is the Literal Solution : Amazon Developer Blogs
2017/2/6に廃止予定だったSlotのAMAZON.LITERALが廃止されないってアップデート。 デベロッパーからは廃止するのをやめてくれと多くの声が上がり、結果的にその声をAmazonが聞いてくれたということ。 AMAZON.LITERALはとりあえずどんなワードでも拾いたい時に使うので、発話內容が決まっていないようなスキルを作る場合には、これが無いと辛いってことになります。
[1/25] 自動運転の実現へ、クリアすべき課題は「音声認識」
車は運転中よそ見は出来ないので音声UIとの親和性は高いと思います。 しかし、運転中だと周りの音や集中していることもあり、結構音声をちゃんと聞き取るのは難しいのかなとも思います。(ナビの音声聞き取れなくて、たまに道間違えちゃうし) 自動車に期待するのは、フロントウィンドウにちょっとした情報が出せるようになって、視点の移動を最低限に抑えられるようなUIと音声UIの組み合わせじゃないかな。 バイクではその機能が本当に欲しい。
[1/26] With Alexa, Just Eat Delivers Your Favorite Flavors with Just a Few Words
With Alexa, Just Eat Delivers Your Favorite Flavors with Just a Few Words : Amazon Developer Blogs
UK発のフードデリバリーサービスJust EatのSkillの話。 Alexaに話しかけるだけでデリバリーしてくれる便利スキルです。 VUIのフロー図が紹介されていて、skillづくりの参考になります。
こういったフロー図から自動的にskillを生成するプロダクトを出してくるスタートアップが出てきそうですね。
[1/24] Alexaに新たな映画で有名なウェイクワードが追加される
増えてましたw
この流れで行くと、次に追加してほしいのは J.A.R.V.I.S.
じゃないですかね。
あとがき
CESでのAlexaフィーバーというべき現象があったおかげで、国内でAlexaに関して取り扱う記事がかなり増えてきた印象です。 開発に絡む記事が増えてくるのも時間の問題ですね。 そんなこともあり、今年は「音声UI元年」と呼ばれる年になるのではないでしょうか。
また、最近テレビで「Alexa〜〜」と流れたせいで、家においてあるAlexaが一斉に反応して人形の家を注文したり、赤ちゃんの発言を拾って間違えてアダルトな內容を喋りまくるという事案が起きているようで、やはり声紋機能がほしいですね。そうすれば、購入時の認証機能や、年齢制限などに利用できるので、より安全な使い方ができるようになりますし。
最近Amazon Alexa界隈で起きたこと(11/26〜12/30)
前回の記事から1ヶ月経って、Amazon Alexa界隈で何が起きたでしょうか。
目次
現時点のSkill数(US)
前回に続いてNews系のSkillがいっぱい増えています。 今のペースでいくと3月頃にはSkill数も1万を超えそうですね。
Alexa AppのSkillカテゴリーに「Newest Arrivals」が増えており、新着のSkillが見やすくなっています。
[11/28] re:Invent 2016で参加者にEcho Dotが配られる
Pick up your Echo Dot at the SWAG desk & start your skill! Sponsored by Alexa & Capital One. #reInvent https://t.co/xGwliRWO2E pic.twitter.com/YfMuBIUqQj
— AWS re:Invent (@AWSreInvent) November 29, 2016
今年のre:Invent参加者には、パーカーだけではなく第2世代のEcho Dotが配られました。 日本からの参加者も700名近いという話ですので、日本国内にも大量のEchoが出回ったことになります。国内では技適の問題で使うとあれですが、興味を持ってSkill作ったりする人がこれから出てくることを考えると楽しみですね。
[12/1] Amazon and Intel Enable New Alexa Use Cases with Reference Design and Skills Integration
IntelとAmazonが組んで、Echoのように離れた場所から話しかけてもちゃんと対話できるようなスマートスピーカーの開発を手助けするform factor reference designs (FFRD) を2017 1Qにデバイスメーカへ提供できるように進めています。
[12/1] Amazon Lex、Amazon Polly発表
re:InventでAlexaの技術を利用したサービスが2つ発表されました。 Amazon Lexは音声やテキストを利用した会話形のアプリケーションを開発するためのプラットフォームです。 Amazon Pollyはtext to speechサービスで、テキストを音声データに変換してくれます。変換先の言語として日本語も用意されています。
PollyとAlexaを組み合わせたSkillを試しに作ってみました。
[12/7] Introducing the ASK Built-in Library Developer Preview
今まではASK向けにIntentやSlotが幾つか用意されていましたが、今回更に100以上のIntentやSlotが追加されました。 上記のブログでは天気についての説明がされていますが、Built-in Intentsを見ると、本、映画、音楽などなど大量に追加されています。 また、Intent Signature Syntaxも大幅に変わっており、今まであったStandard Built-in Intentsとはだいぶ変わりましたね。
[12/8] Conexant's Development Kit for Amazon Alexa
https://developer.amazon.com/alexa-voice-service/dev-kits
Raspberry Piで作れるEchoはウェイクワードの判定にクラウドのサービスを使いますが、この開発キットはボード内でウェイクワードを判定してくれ、更に複数のマイクを搭載しているため、より本物のEchoのようなAVS対応デバイスの開発を手助けしてくれます。
実際にラズパイで自作のEchoを作ってみると分かるのですが、結構反応が悪いです。最初は英語の発音が悪くて反応してくれないのかと思って結構凹む。。しかし、実際にラズパイ上でマイクの入力を録音してみると分かるのが、結構ノイズが乗っている。聞き取れないのかと思って思わず大きな声を出していたのが逆効果で、音が割れまくっています。そりゃ認識できないですよね。 そこで、このような開発キットを使うとそういった問題も減るのかなと思います。
[12/9] 「Google Home」用の「Conversation Action」を開発者が作成可能に
Google HomeにAlexa のSkillみたいなものが出てきそうです。まだ一般公開はされていないようですが、2017年は面白い年になりそうだ。
[12/14] Wynn Las Vegas Announces the Addition of Amazon Echo to All Hotel Rooms
Wynn Las Vegas Announces the Addition of Amazon Echo to All Hotel Rooms
ラスベガスのホテルWynnで全室にAmazon Echoを標準装備するとのこと。4000室以上あるメガホテルに夏頃までに導入という凄い話なのですが、凄いのはそれだけではなく、Echoを介して部屋の照明、エアコン、カーテン、テレビも操作できるようになるということ。 これは、ホテルに遊びに来た人が気軽にスマートホームを体験できるということになります。いやー、さすがラスベガス規模が違いますね。これは、来年のre:InventはWynnに泊まるしかないんじゃないかと。
[12/15] The complete list of Alexa commands so far
Alexaのコマンドリスト。音楽の再生からSkillの追加、イースターエッグなど、多岐にわたるコマンドを紹介。困ったときはとりあえず「Alexa, help」でヘルプを。
[12/17] Alexa Exclusive Deals(Alexaで買い物)
Alexaを通すとオトクな買い物ができるというもの。プライムメンバー向けのサービスで、通常のAmazon.comで買い物するよりも最大40%割引で商品が購入できる。 Alexaで色んな体験をしてもらおうという施策なのかな。 割引の例で、Dotのカバーが33%引き。
[12/20] How to Build a City Guide for Alexa
New Technical Tutorial: How to Build a City Guide for Alexa : Amazon Developer Blogs
都市ガイドのテンプレートの紹介。node.js版のソースも用意されており、簡単なガイドSkillが作れます。都市のニュースを教えてくれる機能もあり、ニュースのデータはNew York TimesのAPIを利用してデータを引っ張ってくれる物となっています。
[12/21] Using Alexa on Fire Tablet
https://developer.amazon.com/blogs/post/fc03c85e-67e4-4516-abae-8c2e972a714a/using-alexa-on-fire-tabletdeveloper.amazon.com
スクリーン付きのEchoが出る噂がありましたが、それより先にFire Tabletに搭載されたことで、スクリーン付きの環境を手に入れました。 通常のEchoではタイマーをセットした後、残り時間を知るためにはEchoに聞く必要がありますが、Fire Tabletではスクリーン上に残り時間が表示されたり、天気のカードが表示されたりと、音声で操作して、結果をヴィジュアルで得られると言う更に使い勝手の良いUIを手に入れたと思います。
[12/23] ユーザーが選ぶSkill 2016年版発表
https://www.amazon.com/gp/adlp/alexa2016
実際にユーザーが利用してたり、レビューが多かったSkillが選出されました。 スマートホームとゲーム系のレビューが多いですね。
ゲームの中に有るThe Magic Doorですが、re:Inventに参加した際にこれの開発者のセッションを聞きました。 どんなSkillと言うと、昔本のRPGがすごく流行ったかと思いますが、それの音声版です。Alexaに話しかけながら物語が進んでいく物で、登場人物の声を変えたり、ドアを開ける効果音なども多分に使われたSkillで結構面白いです。
セッションでは大量のテキスト、音響データの管理、テストなどについて紹介されていました。
[12/27] Alexa skill ki(ASK)を使って、Datadogからの回答が取れるか?
連載記事になるみたいで、今回のはAlexa Skill Kitの開発を行う上での環境を詳しく解説してくれています。ローカル環境上で起動しているSkillに対してAlexaからアクセスできる設定がされていたりと、勉強になります。 私はLambda上で開発することが多いですが、Skillの規模が大きくなってきたらこのようにちゃんと環境を作るほうが効率が良さそうですね。
[12/27] GEアプライアンスとAmazon Alexaが連携し、新たな音声制御Alexaスキルを開発
GEアプライアンスが自社の製品とAlexaを連携させるSkillを開発したとのことです。
GE WiFi Connect - Geneva 製品のページを見ると、オーブン、コーヒーメーカー、冷蔵庫、食器洗機、洗濯機など様々な家電がWi-Fiにつながる機能を持っているので、それらがAlexaのSkill経由で操作できるようです。
[12/27] Windows 10が次に実現する「PCではない未来のデバイス」とは?
Windows 10に搭載されている音声アシスタント「Cortana」が音声によって起動するといったアップデートがされるとのことです。元々Windows 10にはIoT Coreというラズパイでも動く組み込み向けのOSが用意されているので、それでも利用可能になることで、Amazon Echoのようなデバイスが登場するかもしれません。 Google Home、Amazon Echoそして、WindowsのCortanaの登場で2017年は、更に音声UIが注目される歳になりそうです。
[12/28] 「Alexa、犯人は誰だ?」あるAmazon Echoが刑事事件の証拠を握っているかもしれない
このニュースを読んでると、やっぱりずっと音声がクラウドに送られてそうで怖い、、って話になりですが、実際はちょっと違います。 Amazon Echoはウェイクワードを判別するためにずっと周囲の音を拾ってはいますが、その音をすべてクラウドに送っているわけではありません。ウェイクワードはAmazon Echo上で判定され、その後の音声データをクラウドに送っていると言われています。 では、そのウェイクワード以降の音声がすべてサードパーティーが作成したSkillに送られているかというとそんなことはなく、音声認識されたデータはSkillが必要としている情報だけになって送られてきます。 Does the Amazon Echo respect privacy? - Quora
[12/28] Alexa Devices Top Amazon Best-Seller List this Holiday – Millions of Alexa Devices Sold Worldwide
Amazon - Press Room - Press Release
Amazonが年末商戦の数字を幾つか公開しました。 詳しい数字は公開されていませんが、過去最高だったと書かれています。なかでも、Echoシリーズは去年と比べると9倍売れて、百万単位のAlexa搭載デバイスが販売されましたと。2014年の発売からEchoはアメリカで510万台販売されているとのことです。
[12/29] SamsungがAmazon Echoと互換性のあるロボット掃除機をCESに出品
「Alexa, ask Neato to start cleaning」って話しかけると掃除を始めてくれるルンバのような掃除機。 掃除機を操作するだけならAlexaは必要ない気がする、、普通の音声認識で起動できれば良いような。
あとがき
日本では個人で手に入れた人や、re:Inventでの配布で手に入れた人を考えると、国内にはざっくりとですがまだ1000台ぐらいしかAlexaデバイスがないのかなと思います。 一般家庭に音声UIが広がり始めたアメリカと比べて、日本ではまだまだなのが悲しいですね。