熱門資訊
自學(xué)習(xí)機(jī)器人已經(jīng)學(xué)會寫字畫畫啦
來源:3XMaker 發(fā)布時間:2019年07月17日自學(xué)習(xí)機(jī)器人已經(jīng)學(xué)會寫字畫畫啦
機(jī)器人寫字已經(jīng)不是什么大新聞了,但這款機(jī)器人則不同,它的書寫不是通過編程來實現(xiàn),僅僅是通過查看手寫筆跡或草圖它就能學(xué)會,這項創(chuàng)造性的活動由布朗大學(xué)的一名教師和一名本科生共同完成。
這一切的實現(xiàn)都來自于布朗大學(xué)計算機(jī)科學(xué)家開發(fā)的算法,使得機(jī)器人能夠通過模擬人類手寫時的筆劃來書寫文字。研究人員說,這使得人類與機(jī)器人在流暢溝通和緊密合作的道路上邁出了新的一步。
“通過查看單詞或草圖的目標(biāo)圖像,機(jī)器人可以將每個筆畫重現(xiàn)為一個連續(xù)動作。”負(fù)責(zé)算法開發(fā)的本科學(xué)生Atsunobu Kotani說,“這使得人們很難區(qū)分它是由機(jī)器人書寫的還是由人類書寫的。”
該算法利用深度學(xué)習(xí)網(wǎng)絡(luò)來分析手寫單詞或草圖的圖像,并可以推斷出創(chuàng)建它們的可能的筆劃系列。然后,機(jī)器人可以使用它學(xué)到的筆劃來再現(xiàn)單詞或草圖。不僅如此,機(jī)器人還能夠再現(xiàn)粗略的草圖,這其中就包括著名的蒙娜麗莎。
Brown和Kotani顧問的計算機(jī)科學(xué)助理教授Stefanie Tellex表示,這項工作的獨特之處在于機(jī)器人能夠從頭開始學(xué)習(xí)筆畫順序。
這聽起來似乎沒有什么難度,但這對于機(jī)器人來說實屬不易,想當(dāng)年自己在學(xué)寫字的時候也不是一帆風(fēng)順,就知道這一切的不容易,一個字你從哪兒開始寫,字形間架,筆順筆畫,確實是個頭疼的事兒。
要知道,以前那些機(jī)器人能寫字兒是因為程序員代替了機(jī)器人的學(xué)習(xí)過程,直接將書寫的筆順和字形間架編輯成代碼,機(jī)器人照著程序執(zhí)行就完了。但是布朗大學(xué)的這款機(jī)器人則具備了學(xué)習(xí)的能力,你只需要將想要繪制的內(nèi)容展現(xiàn)給它,不需要對筆畫順序進(jìn)行編程,就能重現(xiàn)這些內(nèi)容。
這項工作的另一個顯著方面就是該算法能夠概括和再現(xiàn)筆畫的能力。研究員Kotani使用一組日文字符訓(xùn)練他的深度學(xué)習(xí)算法,該算法可以再現(xiàn)字符并創(chuàng)建它們的筆畫,準(zhǔn)確率約為93%。但令研究人員驚訝的是,這種算法不但能夠重現(xiàn)訓(xùn)練所用日文還能重現(xiàn)其它幾乎不同的字體類型——例如英文版和草書版。這似乎又表明全世界的人都有相同的寫字習(xí)慣啊~
Kotani說,使系統(tǒng)正常工作的關(guān)鍵在于該算法使用了兩種不同的圖像模型。使用將圖像視為整體的全局模型,該算法識別出進(jìn)行第一次筆劃的可能起點。
一旦該筆劃開始,算法就會放大,逐個像素地查看圖像,以確定筆劃應(yīng)該去哪里以及應(yīng)該多長時間。當(dāng)它到達(dá)筆劃的末尾時,算法再次調(diào)用全局模型來確定下一個筆劃應(yīng)該從哪里開始,然后它返回到放大模型。重復(fù)該過程直到圖像完成。
Kotani和Tellex都表示,這項工作是邁向人與機(jī)器人之間更好溝通的一步。他們希望未來的機(jī)器人能夠完成一個人可以完成的一切,寫作和語言就是最為重要的表達(dá)方式。

南京合越智能,增強智造,增強感知,增強交互!
業(yè)務(wù)合作
(我們會第一時間與您聯(lián)系)網(wǎng)站導(dǎo)航
聯(lián)系方式
- 微信:13815863530(手機(jī)同號)
- QQ:38260484
- 3XMaker@163.com