東京2017年6月27日——索尼公司今日宣布其“神經(jīng)網(wǎng)絡(luò)庫(kù)”(Neural Network Libraries)現(xiàn)以開(kāi)放源代碼的形式供公眾使用,該庫(kù)可作為開(kāi)發(fā)人工智能深度學(xué)習(xí)程序的框架。軟件工程師和設(shè)計(jì)師現(xiàn)在能充分利用這些免費(fèi)的核心庫(kù),用于研發(fā)深度學(xué)習(xí)程序并將其融入到產(chǎn)品或服務(wù)中。轉(zhuǎn)為開(kāi)放源代碼也是為了讓研發(fā)隊(duì)伍能在現(xiàn)有核心庫(kù)程序的基礎(chǔ)上更進(jìn)一步。
深度學(xué)習(xí)是指一種使用模擬人腦的神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)形式。通過(guò)轉(zhuǎn)向基于深度學(xué)習(xí)的機(jī)器學(xué)習(xí),過(guò)去幾年,圖像和語(yǔ)音識(shí)別技術(shù)飛速發(fā)展,甚至在某些領(lǐng)域已超越人類。與傳統(tǒng)形式的機(jī)器學(xué)習(xí)相比,尤其值得關(guān)注的是深度學(xué)習(xí)的多功能性,除了圖像和語(yǔ)音識(shí)別之外,還應(yīng)用于包括機(jī)器翻譯、信號(hào)處理和機(jī)器人等各種領(lǐng)域。?
神經(jīng)網(wǎng)絡(luò)設(shè)計(jì)工作對(duì)深度學(xué)習(xí)程序的開(kāi)發(fā)至關(guān)重要。程序員可構(gòu)建最適合手頭任務(wù)的神經(jīng)網(wǎng)絡(luò),例如圖像或語(yǔ)音識(shí)別,并通過(guò)一系列的試驗(yàn)優(yōu)化網(wǎng)絡(luò)性能后,將其加載到產(chǎn)品或服務(wù)中。索尼核心庫(kù)(操作模塊組)中包含的軟件有效地促進(jìn)了上述所有的開(kāi)發(fā)過(guò)程,并融合了以下用于深度學(xué)習(xí)研發(fā)的必要元素。?
多用途執(zhí)行環(huán)境
索尼核心庫(kù)中的軟件主要用C++11編寫(xiě),它是一種在各種環(huán)境(包括圖形處理器GPU在內(nèi)的操作系統(tǒng)和硬件)中運(yùn)行的編程語(yǔ)言,可在Linux,Windows以及其它眾多平臺(tái)上運(yùn)行。?
高效的研發(fā)環(huán)境
除了C++核心庫(kù),索尼還提供一層Python接口功能。Python是用于深度學(xué)習(xí)開(kāi)發(fā)的主流編程語(yǔ)言,可實(shí)現(xiàn)輕松的原型開(kāi)發(fā)和高效開(kāi)發(fā)。因?yàn)樗С种庇^的、具有較少代碼行的神經(jīng)網(wǎng)絡(luò)設(shè)計(jì),所以能讓開(kāi)發(fā)人員專注于創(chuàng)建神經(jīng)網(wǎng)絡(luò),同時(shí)發(fā)展能更高效、更省時(shí)和更節(jié)約成本使用深度學(xué)習(xí)的技術(shù)。?
多功能性
它們既靈活又富有表現(xiàn)力,可跟上不斷創(chuàng)新的深度學(xué)習(xí)領(lǐng)域的最新進(jìn)展,同時(shí)也可應(yīng)付神經(jīng)網(wǎng)絡(luò)的動(dòng)態(tài)性。?
高速運(yùn)行
索尼的核心庫(kù)與英偉達(dá)的GPU兼容,能以可達(dá)到的最快速度進(jìn)行神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)并執(zhí)行,為深度學(xué)習(xí)所支持的技術(shù)研發(fā)創(chuàng)造條件,迭代時(shí)間更短。?
易于修改
此外,在深入學(xué)習(xí)的前沿領(lǐng)域,視需要開(kāi)發(fā)和添加新功能會(huì)十分簡(jiǎn)單。例如,添加優(yōu)化器模組以及作為神經(jīng)網(wǎng)絡(luò)構(gòu)成元素的功能模塊就很簡(jiǎn)單。?
簡(jiǎn)單的硬件移植
核心庫(kù)的構(gòu)建考慮了向新硬件移植的問(wèn)題,所以能夠?qū)崿F(xiàn)向智能手機(jī)和物聯(lián)網(wǎng)設(shè)備等硬件的簡(jiǎn)單轉(zhuǎn)移。?
索尼的研發(fā)平臺(tái)和系統(tǒng)研發(fā)團(tuán)隊(duì)一直將這些核心庫(kù)作為涉及深度學(xué)習(xí)的產(chǎn)品和服務(wù)開(kāi)發(fā)的基礎(chǔ)。這些包括AR Effect,一個(gè)智能增強(qiáng)現(xiàn)實(shí)應(yīng)用程序,用于XperiaTM智能手機(jī)系列的拍照功能;以及Lifelog,一個(gè)使用動(dòng)作識(shí)別技術(shù)的活動(dòng)追蹤小程序;還有Price Estimation Engine(價(jià)格估算引擎),在買賣房地產(chǎn)時(shí)能提供高度準(zhǔn)確的合約價(jià)格估算。?
這項(xiàng)政策是索尼人工智能環(huán)境優(yōu)化倡議的一部分。我們需要更多的商品和服務(wù)使用人工智能提供更高的便利水平,索尼也正在使其核心庫(kù)變?yōu)殚_(kāi)放源代碼,希望更多的開(kāi)發(fā)人員和研究人員能夠本著為社會(huì)做貢獻(xiàn)的目的,在其已有程序的基礎(chǔ)上更進(jìn)一步。?
(本文譯自英文原文,供參考)
**************************************************************************************************************?
索尼公司是世界上民用及專業(yè)視聽(tīng)產(chǎn)品、游戲產(chǎn)品、通信產(chǎn)品、核心部件和信息技術(shù)等領(lǐng)域的先導(dǎo)之一。它在音樂(lè)、影視、電腦娛樂(lè)以及在線業(yè)務(wù)方面的成就也使其成為全球領(lǐng)先的電子和娛樂(lè)公司。公司在截止到2017年3月31日結(jié)束的2016財(cái)年,合并銷售額達(dá)678.86億美元。?
新聞單位如欲查詢更多資料,請(qǐng)聯(lián)絡(luò):pr@sony.com.cn