本月的最熱機器學(xué)習(xí)項目出來了!Mybridge對過去一個月的近250個機器學(xué)習(xí)開源項目進行了排名,甄選出GitHub星數(shù)最多的10大熱門項目。開源項目是機器學(xué)習(xí)研究的寶庫,你一定能從中找到一個能啟發(fā)你的有趣項目。
Mybridge對過去一個月的近250個機器學(xué)習(xí)開源項目進行了排名,甄選出GitHub星數(shù)最多的Top 10熱門項目。
這個列表中10個項目的平均GitHub星星數(shù):1041??
主題包括:DensePose,圖像分類, Mulit-Scale訓(xùn)練,移動AI計算引擎,衛(wèi)星圖像,NLP,Python包,Word detection,NCRF,DALI。
開源項目對程序員來說是很有幫助的。希望你能從中找到一個能啟發(fā)你的有趣項目。
No.1:DensePose:密集人體姿態(tài)估計
DensePose是一種實時的方法,可以將所有2D RGB圖像的人體像素映射到身體的3D表面模型。[Github 2901顆星]來自Facebook的研究
密集人體姿態(tài)估計(Dense human pose estimation)的目的是將RGB圖像的所有人體像素映射到人體的3D表面。DensePose-RCNN是在Detectron框架中實現(xiàn)的,使用的是Caffe2。
作者在這個GitHub存儲庫中提供了訓(xùn)練和評估DensePose-RCNN的代碼。同時還提供了notebook,用于可視化收集的DensePose-COCO數(shù)據(jù)集,并展示與SMPL模型的對應(yīng)關(guān)系。
DensePose-COCO注釋的可視化
項目地址:
https://github.com/facebookresearch/DensePose
No.2:Darts:卷積網(wǎng)絡(luò)和循環(huán)網(wǎng)絡(luò)的可微分架構(gòu)搜索
[Github 1128顆星],來自CMU Hanxiao Liu,Yiming Yang以及DeepMind Karen Simonyan等人的研究。
這個GitHub庫提供了他們的論文“DARTS: Differentiable Architecture Search”中的代碼。在這篇論文中,研究者提出通過以可微分的方式表示任務(wù)來解決架構(gòu)搜索可擴展性的挑戰(zhàn)。該方法基于架構(gòu)表示的連續(xù)松弛(continuous relaxation),允許使用梯度下降來有效搜索架構(gòu)。
該方法能夠有效地設(shè)計用于圖像分類的高性能卷積網(wǎng)絡(luò)架構(gòu)(在CIFAR-10和ImageNet上)和用于語言建模的循環(huán)網(wǎng)絡(luò)架構(gòu)(在Penn Treebank和WikiText-2上), 并且只使用一個GPU,比最先進的非可微分技術(shù)快幾個數(shù)量級。
隨時間推進,卷積網(wǎng)絡(luò)架構(gòu)的搜索
隨時間推進,卷積網(wǎng)絡(luò)和神經(jīng)網(wǎng)絡(luò)架構(gòu)的搜索
項目地址:
https://github.com/quark0/darts
[Github 1352顆星]
SNIPER是一種高效的多尺度(multi-scale)訓(xùn)練方法,用于實例級的識別任務(wù),例如目標(biāo)檢測和實例級分割。SNIPER不是在圖像金字塔中處理所有像素,而是有選擇地處理ground truth對象周圍(也就是芯片)的上下文區(qū)域。這大大加快了在低分辨率芯片上運行的多尺度訓(xùn)練。由于其內(nèi)存的設(shè)計十分高效,SNIPER可以在訓(xùn)練過程中受益于batch normalization,并且可以在單個GPU上完成更大batch-sizes 的實例級識別任務(wù)。因此,我們不需要跨GPU同步batch-normalization 數(shù)據(jù),我們可以訓(xùn)練對象檢測器,就像做圖像分類一樣!
項目地址:
https://github.com/mahyarnajibi/SNIPER
No.4:Mace:專為移動端異構(gòu)計算平臺優(yōu)化的深度學(xué)習(xí)推理框架
[Github 2118顆星]。 來自小米
Mobile AI Compute Engine (MACE)是小米開源的移動端深度學(xué)習(xí)框架,它針對移動芯片特性進行了大量優(yōu)化,目前在小米手機上已廣泛應(yīng)用,如人像模式、場景識別等。
Mace主要從以下的角度做了專門的優(yōu)化:
性能
代碼經(jīng)過NEON指令,OpenCL以及Hexagon HVX專門優(yōu)化,并且采用Winograd算法來進行卷積操作的加速。 此外,還對啟動速度進行了專門的優(yōu)化。
功耗
支持芯片的功耗管理,例如ARM的big.LITTLE調(diào)度,以及高通Adreno GPU功耗選項。
系統(tǒng)響應(yīng)
支持自動拆解長時間的OpenCL計算任務(wù),來保證UI渲染任務(wù)能夠做到較好的搶占調(diào)度, 從而保證系統(tǒng)UI的相應(yīng)和用戶體驗。
內(nèi)存占用
通過運用內(nèi)存依賴分析技術(shù),以及內(nèi)存復(fù)用,減少內(nèi)存的占用。另外,保持盡量少的外部 依賴,保證代碼尺寸精簡。
模型加密與保護
模型保護是重要設(shè)計目標(biāo)之一。支持將模型轉(zhuǎn)換成C++代碼,以及關(guān)鍵常量字符混淆,增加逆向的難度。
硬件支持范圍
支持高通,聯(lián)發(fā)科,以及松果等系列芯片的CPU,GPU與DSP(目前僅支持Hexagon)計算加速。 同時支持在具有POSIX接口的系統(tǒng)的CPU上運行。
項目地址:
https://github.com/XiaoMi/mace
No. 5:Robosat:用于航空和衛(wèi)星圖像的語義分割工具
[Github 886顆星]。由Salesforce打造
RoboSat是用Python 3編寫的一個端到端的pipeline,用于從航空圖像和衛(wèi)星圖像中提取特征。特征可以是任何視覺上可區(qū)分的東西,例如:建筑物,停車場,道路,或汽車。
RoboSat提供的工具可分為以下幾類:
數(shù)據(jù)準(zhǔn)備:為訓(xùn)練特征提取模型創(chuàng)建數(shù)據(jù)集
訓(xùn)練和建模:用于圖像中特征提取的分割模型
post-processing:將分割結(jié)果轉(zhuǎn)換為簡潔的幾何圖形
項目地址:
https://github.com/mapbox/robosat
No.6 decaNLP:處理自然語言任務(wù),一個頂十個
[Github 776顆星]
自然語言十項全能(decaNLP)的目標(biāo)是構(gòu)建一個能夠完成十項自然語言任務(wù)的通用模型,這些任務(wù)包括:問答、機器翻譯、摘要、自然語言推理、情感分析、語義角色標(biāo)注、關(guān)系抽取、目標(biāo)導(dǎo)向?qū)υ?、語義分析、常識代詞消解。每個任務(wù)都被轉(zhuǎn)換為問答問題,以便使用新的多任務(wù)問題應(yīng)答網(wǎng)絡(luò)(Multitask Question Answering Network,MQAN)。該模型聯(lián)合學(xué)習(xí)decaNLP中的所有任務(wù),并且在多任務(wù)設(shè)置中不使用任何特定于任務(wù)的模塊或者參數(shù)。
項目地址:
https://github.com/salesforce/decaNLP
No.7 Magnitude:一個快速、高效的通用矢量嵌入實用包
[Github 427顆星]
Magnitude是一個功能豐富的Python包和矢量存儲的文件格式,用于以快速、高效、簡單的方式使用機器學(xué)習(xí)模型中的向量嵌入(由Plasticity開發(fā))。它逐漸成為“輕量版”的Gensim,但卻可以用于NPL之外的領(lǐng)域,作為一種通用的關(guān)鍵向量(key-vector)存儲。
項目地址:
https://github.com/plasticityai/magnitude
No.8 Porcupine:由深度學(xué)習(xí)驅(qū)動的設(shè)備喚醒詞檢測引擎
[Github 373顆星]
Porcupine是一款自助式,高精度,輕量級的喚醒字檢測引擎。它使開發(fā)人員能夠構(gòu)建始終監(jiān)聽(always-listening)語音的應(yīng)用程序/平臺。
自助式:開發(fā)人員有權(quán)在幾秒鐘內(nèi)選擇任何喚醒詞并構(gòu)建其模型。
在現(xiàn)實場景中用深度神經(jīng)網(wǎng)絡(luò)進行訓(xùn)練
由于它緊湊且計算效率高,使其適用于物聯(lián)網(wǎng)的應(yīng)用
跨平臺:它是在純定點ANSI C中實現(xiàn)的。目前支持Raspberry Pi、Android、iOS、watchOS,Linux,Mac和Windows。
可擴展性:它可以同時檢測數(shù)十個喚醒詞,幾乎不增加CPU/內(nèi)存占用。
開源:在這個存儲庫中找到的任何東西都是Apache 2.0許可的。
項目地址:
https://github.com/Picovoice/Porcupine
No.9 NCRF:神經(jīng)條件隨機場,檢測腫瘤轉(zhuǎn)移
[Github 290顆星]
由百度深度學(xué)習(xí)研究院提出,其文章結(jié)構(gòu)如下(附代碼和數(shù)據(jù)):
NCRF介紹
準(zhǔn)備工作
數(shù)據(jù)介紹
模型介紹
訓(xùn)練
測試
項目地址:
https://github.com/baidu-research/NCRF
No.10:NVIDIA DALI
這是一個包含高度優(yōu)化的構(gòu)建模塊和用于深度學(xué)習(xí)應(yīng)用中數(shù)據(jù)預(yù)處理執(zhí)行引擎的庫。NVIDIA DALI可加速深度學(xué)習(xí)應(yīng)用程序的輸入數(shù)據(jù)預(yù)處理。 DALI 提供加速不同數(shù)據(jù)管道的性能和靈活性,作為一個單獨的庫,可以輕松集成到不同的深度學(xué)習(xí)訓(xùn)練和推理應(yīng)用程序中。
DALI的主要亮點包括:
從磁盤讀取到準(zhǔn)備訓(xùn)練/推理的完整的數(shù)據(jù)流水線;
可配置圖形和自定義操作員的靈活性;
支持圖像分類和分割工作量;
通過框架插件和開源綁定輕松實現(xiàn)集成;
具有多種輸入格式的便攜式訓(xùn)練工作流 - JPEG,LMDB,RecordIO,TFRecord;
通過開源許可證可擴展以滿足用戶的特定需求
-
圖像
+關(guān)注
關(guān)注
2文章
1079瀏覽量
40375 -
機器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8353瀏覽量
132315 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1200瀏覽量
24622
原文標(biāo)題:【干貨】7月機器學(xué)習(xí)Top 10,GitHub平均1041星!
文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關(guān)推薦
評論