人工智能是引領(lǐng)社會發(fā)展的戰(zhàn)略性技術(shù),它在提升國家競爭力、維護國家安全、重塑行業(yè)發(fā)展新優(yōu)勢等方面發(fā)揮著至關(guān)重要的作用。世界主要發(fā)達國家都已將人工智能作為一項重大戰(zhàn)略,2017我國政府工作報告指出要加快培育壯大包括人工智能在內(nèi)的新興產(chǎn)業(yè),并把人工智能領(lǐng)域建設上升為國家戰(zhàn)略層面。
人工智能的研究范疇包括自然語言處理、知識表現(xiàn)、智能搜索、推理、規(guī)劃、機器學習、知識獲取、組合調(diào)度問題、感知問題、模式識別、神經(jīng)網(wǎng)絡等,實際應用領(lǐng)域包括機器視覺、指紋識別、人臉識別、視網(wǎng)膜識別、虹膜識別、掌紋識別、專家系統(tǒng)、自動規(guī)劃、智能搜索、定理證明、博弈、自動程序設計、智能控制、機器人學、圖像和語言理解、遺傳編程等。
人工智能早已遍布于我們的日常生活中,它已經(jīng)成為經(jīng)濟發(fā)展的新引擎、社會發(fā)展的加速器,人工智能技術(shù)正在滲透并重構(gòu)生產(chǎn)、分配、交換、消費等經(jīng)濟活動的各個環(huán)節(jié),形成從宏觀到微觀各領(lǐng)域的智能化新需求、新產(chǎn)品、新技術(shù)、新業(yè)態(tài),改變?nèi)祟惿罘绞缴踔辽鐣Y(jié)構(gòu),實現(xiàn)社會生產(chǎn)力的整體躍升。推動人工智能人才培養(yǎng),推動人工智能理論發(fā)展,推動人工智能行業(yè)滲透逐漸成為現(xiàn)代高等教育在人工智能領(lǐng)域新的使命與任務。
與其他傳統(tǒng)技術(shù)不同,人工智能技術(shù)以市場驅(qū)動技術(shù)革新。2017年,人工智能在全國范圍內(nèi)經(jīng)歷了快速成長,從國家頂層規(guī)劃出臺,逐步延伸到各地人工智能創(chuàng)新創(chuàng)業(yè)的落地,以智能安防、智能金融、智能醫(yī)療、智能交通為代表的行業(yè)應用,已經(jīng)成為熱門的創(chuàng)業(yè)和投資領(lǐng)域。人工智能市場將保持高速增長,BBC預估2020年全球AI市場規(guī)模約為1190億人民幣。目前,在國外科技巨頭如微軟、谷歌、Facebook 等積極布局人工智能領(lǐng)域的同時,國內(nèi)各路互聯(lián)網(wǎng)資本巨頭如阿里、騰訊、百度、京東等也紛紛爭相切入到人工智能產(chǎn)業(yè),充分展示了科技領(lǐng)頭羊?qū)τ谖磥硎袌龅拿翡J嗅覺。
近年來我國人工智能產(chǎn)業(yè)步入高速發(fā)展階段,在人工智能芯片、產(chǎn)品及服務等關(guān)鍵領(lǐng)域里涌現(xiàn)出一批優(yōu)秀的企業(yè),其中商湯科技、曠世科技等估值均已超過百億人民幣,成為推動人工智能發(fā)展的重要力量。
但是我國人工智能整體發(fā)展水平與發(fā)達國家相比仍存在著差距、缺少重大原創(chuàng)成果,在技術(shù)理論、核心算法以及關(guān)鍵設備、高端芯片等方面仍有差距,人工智能產(chǎn)業(yè)的競爭,說到底是人才和知識儲備的競爭。只有投入更多的科研人員,不斷加強基礎研究,才會獲得更多的智能技術(shù)。
2.設計思路
人工智能專業(yè)課程體系主要包括學科基礎課、專業(yè)基礎課、專業(yè)核心課程以及前景平臺及應用導向課程等,其中學科基礎課程主要包括數(shù)學類課程、計算機編程基礎類以及電子電路基礎等課程,而專業(yè)基礎課主要包括行業(yè)通用類技術(shù)的機器學習、Python語言與程序設計、人工智能基礎以及數(shù)據(jù)挖掘等課程,專業(yè)核心課程主要包括數(shù)字圖像處理、機器視覺、模式識別、自然語言處理、深度學習技術(shù)、人工神經(jīng)網(wǎng)絡技術(shù)、博弈論等課程等,面向行業(yè)應用導向的前景平臺課程主要包括人工智能前沿技術(shù)、智能機器人、無人機等。
實驗室建設以該課程體系為基礎,著眼于學生基礎編程和算法能力的培養(yǎng),同時依托外設模塊,對人工智能技術(shù)在相關(guān)領(lǐng)域的應用進行呈現(xiàn),為學生提供一個集基礎編程、算法分析、應用實踐于一體的平臺。
DB-SD38 AI語音與機器視覺開發(fā)應用系統(tǒng)平臺
AI語音與機器視覺開發(fā)應用系統(tǒng)平臺是一款集成AI語音、機器視覺、深度學習、嵌入式Linux于一體的高端教學科研實驗平臺。
整個教學平臺由實驗箱高性能嵌入式主板夠成,高性能嵌入式核心板采用高性能64位ARM處理器,標配4GB DDR3內(nèi)存和16GB閃存,可運行ubuntu、android、linuxqt等多種操作系統(tǒng),可滿嵌入式linux和AI應用開發(fā)。
平臺采用多核高性能 AI 處理器,預裝 Ubuntu Linux 操作系統(tǒng)與 OpenCV 計算機視覺庫,支持 TensorFlow Lite、NCNN、MNN、Paddle-Lite、MACE 等深度學習端側(cè)推理框架。
提供多種應用外設與豐富的機器視覺、AI語音、深度學習實戰(zhàn)應用案例,如語音前處理(聲源定位、語音增強、語音降噪、回聲消除、聲音提取)、語音活體檢查、語音喚醒、語音識別、語音合成、自然語言處理、聲紋識別門鎖、語音智能家居、手寫字識別、人臉識別、目標檢測、端側(cè)推理框架、圖像識別、人體分析 、文字識別、人臉門禁控制、車牌道閘控制、手勢家居控制等,通過案例教學讓學生掌握計算機視覺與深度學習的基本原理和典型應用開發(fā)。
2.2.1. 嵌入式網(wǎng)關(guān)核心板
RK3399核心板是一款266-pin金手指形式高性能ARM計算機模塊,它采用了瑞芯微64位六核(包含雙核Cortex-A72 +四核Cortex-A53)Soc RK3399作為主處理器,標配4GB DDR3內(nèi)存和16GB閃存,板載2×2 MIMO雙天線Wi Fi模組,尺寸只有69.6×50mm,模塊上帶有獨立的Typec供電接口,以及USB-C顯示接口。RK3399計算模塊具有豐富的外設和擴展接口,可以擴展使用雙MIPI寬動態(tài)攝像頭,另外它還帶有eDP顯示接口,MIPI顯示接口,1路USB3.0,2路USB2.0,以及12C,12S,SPI,PWM,GF10和串口等各種資源。RK3399可流暢運行Android 8.1,Ubuntu 18.04,Armbian,Buildroot等主流嵌入式操作系統(tǒng),軟件資源和生態(tài)非常豐富,尤其是Android 8.1具有NN SDK神經(jīng)網(wǎng)絡加速軟件包,Qt-5.10集成了VPU硬件編解碼,GPU圖形加速,可使用QML快速開發(fā)流暢的動態(tài)式界面,因此RK3399核心板非常適合做高端人臉識別,機器視覺,VR虛擬現(xiàn)實,自動駕駛,深度計算分析等方面的人工智能產(chǎn)品快速原型及產(chǎn)品開發(fā)。
硬件參數(shù):
CPU |
SOC:RK3399 核心:64位雙核Cortex-A72 +四核Cortex-A53 頻率:Cortex-A72 (2.0 ghz), Cortex-A53 (1.5 ghz) |
GPU | Mali-T864 GPU,支持OpenGL ES1.1/2.0/3.0/3.1、OpenVG1.1 OpenCL, DX11, AFBC |
VPU | 4K VP9 and 4K 10bits H265/H264 60fps decoding, Dual VOP, etc |
Memory | RAM: Dual-Channel 4GB DDR3 |
Storage | eMMC: 16GB(regular), 32GB/64GB(optional), eMMC 5.1 |
Power Management | RK808-D PMIC,配合獨立直流/直流,啟用dvf solfware省電,RTC喚醒,系統(tǒng)睡眠模式 |
Connectivity |
以太網(wǎng):本機千兆以太網(wǎng) wi - fi: 802.11 a / b / g / n / ac 藍牙:4.1雙模式 天線:雙天線接口 |
Video Input | 1個或兩個4-Lane MIPI-CSI,雙重ISP, 13 mpix / s,同時支持雙相機數(shù)據(jù)的輸入 |
Video Output |
HDMI: HDMI 2.0a, supports 4K@60Hz,HDCP 1.4/2.2 DP on Type-C: DisplayPort 1.2 Alt Mode on USB Type-C LCD Interface: one eDP 1.3(4-Lane,10.8Gbps), one or two 4-Lane MIPI-DSI |
USB |
USB 2.0: 2獨立的本地主機USB 2.0 USB 3.0: 1本地主機USB 3.0 USB c類型:支持USB3.0 c型和顯示端口1.2 Alt模式USB c型 |
PCIe | PCIe x4, compatible with PCIe 2.1, Dual operation mode |
調(diào)試 | 1 x調(diào)試UART, 3 v級,1500000個基點 |
LED | 1x Power LED(Red) 1x GPIO LED(Green) |
Key | Power Key x1 Reset Key x1 Recovery Key x1 |
工作溫度 | -20℃ to 70℃ |
電源 | 直流12 v / 1(邊緣連接器)或DV 5 v / 2.5 (c型) |
2.2.2. 網(wǎng)關(guān)底板其他外設
l 11.6寸高清觸顯一體屏:板載,eDP接口,電容式多點觸摸,分辨率1920*1080
l 按鍵:板載重啟、恢復、電源3個功能按鍵,4個用戶自定義按鍵
l UART:1路RS232,1路RS485
l 以太網(wǎng):100/1000M
l 音頻:音頻輸出接口、MIC音頻輸入接口、板載4歐3W揚聲器
l 無線網(wǎng):WiFi (2.4G and 5G, 802.11 ac), Bluetooth 4.1
l 4G模組:板載,板載EC20模組
l LoRaWAN網(wǎng)關(guān)模塊接口:板載mini-pcie接口,可接入SX1301八通道并行LoRaWAN網(wǎng)關(guān)模塊。1個項目須至少配備1個LoRaWAN網(wǎng)關(guān)模塊,以實現(xiàn)對實驗室所有l(wèi)ora節(jié)點的接入管理。
l Zigbee網(wǎng)關(guān)模塊:板載,直列雙排20芯插針接口,非usb接口。
l BLE網(wǎng)關(guān)模塊:板載,直列雙排20芯插針接口,非usb接口。
l USB 3.0 HOST接口:板載2個
l Debug接口:板載1個
l Download接口:板載1個
l 鍵盤:板載7寸80鍵標準鍵盤
l 高清相機模組:CMOS傳感器OV13850,MIPI信號輸出,400萬像素,最高支持2688x1520像素。
l 麥克風陣列:板載7顆數(shù)字高性能硅麥克風。
l 紅外接收:板載紅外接收模塊1個
l 震動馬達傳感器:1個
l LED:板載4顆藍色LED燈珠。
l 天線接口:板載wifi、BLE、lora、LET 共4個天線接口。
l 傳感器擴展接口:板載,與無線傳感器節(jié)點的傳感器模塊接口兼容,可完成linux系統(tǒng)下的傳感器驅(qū)動開發(fā)實驗。
l OBD接口:板載,標準16針OBD-II插座,與配套軟件結(jié)合可完成基于CAN總線通信相關(guān)實驗。
l
電源:DC 9-12V輸入
l 其他接口:MIPI、GPIO、SPI、I2C、TF Card (sd/mmc 3.0)、SIM卡座、USB 2.0 HOST、USB Type-C (with DP out)、eDP 1.3、HDMI 2.0 for 4K 60Hz
2.3. 外設模塊
2.3.1.
4G LTE模塊l 網(wǎng)絡:FDD-LTE/TDD-LTE/WCDMA/TD-SCDMA/GSM/EDGE;
l 制式:CMCC/CUCC(B1/B3/B8/B34/B38/B39/B40);
l 工作頻帶:HSPA1900/2100,GSM 900/1800;
l 高速USB 2.0接口、PCI-E接口;
l 支持短信、數(shù)據(jù)、電話本、PCM語音功能;
l 支持IPv4,IPv6協(xié)議;
l 支持LTE多頻;
l 支持最大150M/50Mbps的理論上下行數(shù)據(jù)傳輸速率;
2.3.2. AI麥克風陣列
l 7路麥克風陣列,提供聲源定位、語音增強、語音降噪、回聲消除、聲音拾取等功能。l 帶硬件浮點運算的RISC-V 雙核64位處理器,主頻最高800MHz。
l 具備機器聽覺能力和語音識別能力,內(nèi)置語音處理單元(APU)。
l 具備卷積人工神經(jīng)網(wǎng)絡硬件加速器KPU,可高性能進行卷積人工神經(jīng)網(wǎng)絡運算。
l 麥克風陣列模塊集成TFT彩屏屏,能夠直觀顯示音頻頻譜圖。
l 內(nèi)置ARM STM32 USB音頻驅(qū)動芯片,提供USB聲卡驅(qū)動,開放源代碼。
l 接口:雙列直插封裝/USB,需能夠接入到eAIOT平臺使用。
l 支持語音識別、語義理解、語音合成、人機對話等功能,可與硬件進行語音交互。
l 5米監(jiān)測范圍、基于linux系統(tǒng)。
2.3.3. AI攝像頭
l 1/1.8" SONY Exmor CMOSl 有效像素200萬像素,30幀@1920*1080
l C/CS鏡頭接口,最低照度0.001 Lux,120dB TWDR
l 支持協(xié)議:PROFILE S,GB/T28181,F(xiàn)TP/RTSP.UPNP等
l 支持雙碼流、手機監(jiān)控、心跳機制,具3D降噪、去霧、數(shù)字寬動態(tài)、鏡頭校正、走廊監(jiān)控等智能模式
l 提供基于eAIOT教學平臺的人臉識別系統(tǒng)案例。
2.4. 物聯(lián)網(wǎng)應用基礎云平臺
1、功能簡介1)學生能夠?qū)⑽锫?lián)網(wǎng)感知層設備(傳感器、執(zhí)行器等)接入物聯(lián)網(wǎng)云服務平臺,平臺能夠接收并存儲傳感器和執(zhí)行器的實時數(shù)據(jù),模塊在線狀態(tài),并實時顯示。
2)提供后臺管理系統(tǒng),能夠設置賬號類型和使用權(quán)限。支持多用戶管理及權(quán)限控制,分為父用戶和子用戶,父用戶可以創(chuàng)建多個子用戶,并且可以為每個子用戶分配增、刪、改幾種權(quán)限,子用戶創(chuàng)建的資源相互隔離。
3)提供物聯(lián)網(wǎng)規(guī)則編輯器,無需編寫代碼即可編輯復雜的自動化控制策略,實現(xiàn)移動互聯(lián)網(wǎng)系統(tǒng)的自動化控制。
4)提供豐富的可視化控件庫,通過拖拽、簡便配置即可完成美觀的UI設計。支持GIS地圖、曲線圖、柱狀、餅圖、圖表、按鈕、儀表圖等控件。
5)物聯(lián)網(wǎng)感知層設備也能夠向執(zhí)行器發(fā)送控制命令,系統(tǒng)能夠?qū)崿F(xiàn)模塊的在線監(jiān)測。
6)云平臺支持物聯(lián)網(wǎng)硬件多協(xié)議接入,通過ZigBee/BLE/wifi/lora/NBIOT無線技術(shù)取得傳感器采集的數(shù)據(jù),形成一個完整的無線傳感器網(wǎng)絡。
7)數(shù)據(jù)通過http/MQTT協(xié)議傳輸至物聯(lián)網(wǎng)應用基礎云平臺軟件,進行數(shù)據(jù)圖形化展示。
8)實現(xiàn)基于云平臺的智能家居實驗,并包含配套完整的教學資源。
9)支持本地化部署和云端部署兩種方式。
10)提供“物聯(lián)網(wǎng)應用基礎云平臺”軟件著作權(quán)登記證書及軟件產(chǎn)品登記測試報告復印件并加蓋公章,原件備查。
3. 部分實驗案例
3.1.1. 嵌入式linuxQT綜合實驗
3.1.2. 手寫字識別
學習設計一個神經(jīng)網(wǎng)絡模型,然后用已經(jīng)標注過的MNIST數(shù)據(jù)來訓練這個模型,然后進行測試驗證。
圖:手寫字識別案例
3.1.3. 人臉識別
通過OpenCV自帶的分類器、OpenCV的深度學習分類器是基于SSD(Single Shot Detector)框架的ResNet網(wǎng)絡,實現(xiàn)在圖片、視頻中對人臉的檢測,并用矩形框框出來。學?捎糜谏矸葑R別、課堂/上下班考勤、會議簽到、刷臉支付、門禁通行、安防監(jiān)控相關(guān)場景。
圖: 人臉識別案例
3.1.4. 目標檢測
利用深度學習框架caffe,實現(xiàn)對常見物體的檢測。
圖:目標檢測案例
3.1.5. 人體姿態(tài)識別
使用邊緣側(cè)推理框架Tengine檢測圖像中的所有人體并返回每個人體的矩形框位置,精準定位 21 個核心關(guān)鍵點,包含五官、四肢、脖頸等部位,更多關(guān)鍵點持續(xù)擴展中;支持多人檢測、人體位置重疊、遮擋、背面、側(cè)面、中低空俯拍、大動作等復雜場景。
圖:人體姿態(tài)識別案例
3.1.6. 手勢識別
利用深度學習框架caffe,實現(xiàn)對簡單手勢的識別。
圖:手勢檢測和識別系統(tǒng)案例
3.1.7. 車牌識別
使用opencv 的 HAAR Cascade 檢測車牌大致位置,使用卷積神經(jīng)網(wǎng)絡回歸車牌左右,然后使用卷積神經(jīng)網(wǎng)絡滑動窗切割字符、及識別字符。
圖:交通門禁車牌檢測和識別系統(tǒng)案例
3.1.8. 人臉門禁
采用 mtcnn 進行人臉檢測,采用MobileFaceNet 進行人臉識別,然后用活體檢測算法進行檢測。
圖:人臉門禁檢測和識別系統(tǒng)案例
3.1.9. 聲紋鎖實驗
通過語音增強、語音質(zhì)量檢測、語音增強、有效語音提取、聲紋特征提取等步驟,完成聲紋注冊及聲紋驗證。
圖:聲紋電子鎖系統(tǒng)案例
3.1.10. AI語音控制智能家居
本系統(tǒng)實現(xiàn)語音數(shù)據(jù)高速傳輸,基于百度語音識別 API 完成語音識別,并用無線方式控制電燈,電風扇,以及獲取溫度和濕度。
圖:語音控制智能家居系統(tǒng)案例
3.1.11. 知識圖譜和聊天機器人
知識圖譜融合了兩千五百多萬的實體,擁有億級別的實體屬性關(guān)系,機器人采用了基于知識圖譜的語義感知與理解,致力于最強認知大腦。自然語言處理工具包的功能有:中文分詞、詞性標注、命名實體識別、關(guān)鍵詞提取、文本摘要、新詞發(fā)現(xiàn)、情感分析等。
圖:知識圖譜和文本聊天機器人系統(tǒng)案例