[Day 24] Google Dialogflow - 1

今天要介紹新的服務:Dialogflow。這部分說明文件繞來繞去,最後導到新的網址:https://cloud.google.com/dialogflow/docs/how

這邊比較可惜是沒有簡易的測試可以玩,我們就先透過UI建立一個agent,建立一個簡單的Dialogflow流程體驗一下。

快來這邊體驗Dialogflow的UI吧:https://dialogflow.cloud.google.com/#/getStarted

建立Agent:https://dialogflow.cloud.google.com/#/newAgent

選擇中文並選擇project以後,按下建立就可以建立一個新的dialogflow。
create agent

Read More  

[Day 23] Google Cloud Speech-to-Text - 子系列最終章

因為這邊沒有AutoML的關係,所以今天是Speech-to-Text的最後一篇。

在doc文件裡的這篇是介紹如何使用Mic直接stream翻譯成文字,但我docker環境沒特別access host的mic,所以沒有測試這段。

中文Speech-to-Text

仔細測了一下,昨天的範例無法直接串接中文語音轉文字,原來是因為昨天使用的版本是v1,但中文相關的分析必須使用v1p1beta1,另一個原因是之前的檔案try.m4a一直測試都無法讀取,我把他轉為try.mp3以後,才可以順利解析。

Read More  

[Day 22] Google Cloud Speech-to-Text - 2

這個步調而言,今天就是Cloud Speech-to-Text API串接,前情提要一樣是要先建立project、Enable API、下載credential json之類的。忘了的人記得看這系列第三天的文章。

好,現在要先來把test data抓下來,我們可以在google的github上找到很多檔案可以測試,我這邊抓的是audio.raw,並把它放到testdata/speech_to_text資料夾下。

Read More  

[Day 21] Google Cloud Speech-to-Text - 1

今天來講第六個服務,寫到第21天終於第六個了。這個服務跟前幾天的Text-to-Speech剛好相反,是把聲音轉成文字。這服務號稱可以辨識120種語言跟其變化,更開心的是它可以辨識中文,還有廣東話、日文之類的語言也都可以。

當然每個系列的第一天都是玩一下他提供的demo,不過這很像是最後一個有提供demo的服務,接下來還得要調整步調。
大家可以先透過錄音程式錄一段話,然後再將檔案上傳:
voice recorder

Read More  

[Day 18] Google Cloud Text-to-Speech - 1

今天來介紹Google另一個AI服務:文字轉語音(Text-To-Search)。把一段文字丟入以後,他可以唸出來給你。這套服務目前還沒有AutoML的UI介面可以操作,我們就只能看看API跟demo的操作。

在Text-To-Search裡,Google有使用到WaveNet模型,這套模型用了大量的語音去訓練AI,讓AI能知道哪些字接著哪些字應該怎麼發音,讓聲音更像人說出來的一樣。

更詳細的WaveNet可以看Google這邊的介紹:https://cloud.google.com/text-to-speech/docs/wavenet
還可以聽一下不是WaveNet說的話,跟WaveNet說的話之間的差別

Read More  

[Day 17] Google Translation - 子系列最終章

今天要講AutoML translation的部分,這部分在官網上一直沒找到對應的範例,很有可能範例要自己生。我只好自己在網路上找些翻譯的dataset,幸好在這邊有找到很多很多的資料集,只需要做一些資料處理的動作,現在就來先處理一下。

我下載的資料集:News Commentary,並取出中文跟英文的部分。

Read More  

[Day 16] Google Translation - 3

還記得昨天在串API的時候,有特別提到Google Translate API在Go client library沒有v3beta1的版本。秉持著練習golang的精神,看到v3beta1有RESTful API,就花了點時間來串一下。

Google translate API v3

我這邊參考的是Using the command line的內容,使用CURL的方式呼叫,並把他改寫成Go req (http client)這類型的RESTful API call。仔細想想,要解決的問題有兩個:1. Get Access token、2. 呼叫restful api。

Read More  

[Day 15] Google Translation - 2

昨天玩完了Demo,按照步調今天就用Code來實踐吧。在下筆的時候Client Library有v2v3beta1兩個版本,但Golang只有v2的Example,需要的話就只能用Golang執行CURL POST去呼叫v3beta1版API,所以我這邊就先使用v2來試試看。

Translate Text

架構一樣是在modules底下建立一個translation.go的module
還有要記得抓credential json下來,可以參考這系列第三天的文章

Read More