0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

機器學習和數(shù)據(jù)科學技術(shù)在工業(yè)界開源應用的Github項目

WpOh_rgznai100 ? 來源:lq ? 2019-07-18 15:30 ? 次閱讀

【導語】隨著機器學習和數(shù)據(jù)科學的不斷發(fā)展,相關技術(shù)在越來越多的領域得到了應用,機器學習、數(shù)據(jù)科學和其他學科的結(jié)合已經(jīng)成為了必然趨勢。在本文中,我們給大家分享了一個包含機器學習和數(shù)據(jù)科學技術(shù)在工業(yè)界開源應用的 Github 項目,具體領域包括會計、銀行和保險業(yè)務、法律和法規(guī)、政府和公共政策等等。該項目仍在持續(xù)更新中。

隨著機器學習和數(shù)據(jù)科學技術(shù)的不斷發(fā)展,在工業(yè)界出現(xiàn)了越來越多的相關技術(shù)應用,學科交叉已經(jīng)成為必然趨勢。

在今天的分享中,營長為大家選取了一個來自GitHub的項目,該項目整理了機器學習和數(shù)據(jù)科學在工業(yè)界的落地應用,應用領域包括會計、銀行和保險業(yè)務、法律和法規(guī)、政府和公共政策等領域。在該項目中,除非特別注明,作者分享的大部分項目都基于 Python 。另外,為了使得項目代碼更具參考性,該項目列表沒有包含明確聲明“不再更新”或者已超出2年未更新的相關項目。

先為大家梳理了一下該項目的相關內(nèi)容,以便大家快速查看。如果希望進一步了解相關內(nèi)容,可查看文末的 GitHub 項目地址。

在該項目中,作者嘗試對機器學習和數(shù)據(jù)科學在工業(yè)界的具體應用情況進行匯總,預計包含的領域如下表:

目前,作者已經(jīng)整理了會計、銀行和保險業(yè)務、法律和法規(guī)、政府和公共政策四個領域的相關開源項目情況,并進行了歸納和匯總。對于每個領域,作者對相關資源進行了分類和項目匯總,并給出了每個項目的鏈接和簡短介紹。該項目列表仍在持續(xù)更新中。

領域:會計

作者將會計相關的應用劃分為7類,包括機器學習、數(shù)據(jù)分析、文本分析、數(shù)據(jù)獲取與處理、相關研究和文章、網(wǎng)站、課程。下面對各部分進行分別介紹。

機器學習

1.Chartof Account Prediction:使用帶標簽的數(shù)據(jù)集預測每筆交易的賬戶名稱。

2.AccountingAnomalies:使用深度學習框架識別會計信息中的異常。

3.FinancialStatement Anomalies:基于 R語言,在會計文件歸檔前檢測會計異常信息。

4.UsefulLife Prediction:使用傳感器數(shù)據(jù)和特征工程預測資產(chǎn)的可使用年限。

5.AI Applied to XBRL:將可擴展商業(yè)報告語言(XBRL)用于 AI 和機器學習。

數(shù)據(jù)分析

1.ForensicAccounting:包含使用數(shù)據(jù)分析手段進行法務會計的案例研究集合。

2.GeneralLedger:對會計系統(tǒng)中的總賬進行數(shù)據(jù)處理。

3.BulletGraph:以子彈圖(bullet graph)形式對銷售、委托及其他會計活動進行可視化。

4.AgedDebtors:對長期債務人的案例分析。

5.AutomatedFS XBRL:自動生成 XBRL ,也可使用 python 格式輸出。

文本分析

1.FinancialSentiment Analysis:對交易信息進行情感分析、距離分析和交易份額分析。

2.Extensive NLP:針對會計研究的 NLP 技術(shù)匯總。

數(shù)據(jù),句法分析和 APIs

1.EDGAR:獲取電子化數(shù)據(jù)收集、分析及檢索系統(tǒng)(EDGAR)數(shù)據(jù)的指南。

2.IRS:獲取美國國家稅務局(IRS)歸檔數(shù)據(jù)并進行句法分析的指南。

3.FinancialCorporate:羅格斯大學提供的金融數(shù)據(jù)集

4.Non-financialCorporate:羅格斯大學提供的非金融公司數(shù)據(jù)集

5.PDFParsing:從 PDF 文件中抽取有用信息

6.PDFTabel to Excel:從 PDF 文件中輸出表格

研究和文章

1.UnderstandingAccounting Analytics:介紹了會計分析的重要性。

2.VLFeat:一個計算機視覺算法的開源庫,并且提供了 Matlab 工具。

網(wǎng)站

1.RutgersRaw:羅格斯大學的數(shù)字會計研究

課程

1.ComputerAugmented Accounting:羅格斯大學的系列視頻課程,主要講解如何將計算機手段應用到會計中。

2.Accountingin a Digital Era:羅格斯大學的系列視頻課程,主要講解數(shù)字時代對會計的影響。

領域:銀行和保險業(yè)

作者將該領域歸納為7部分內(nèi)容,包括消費經(jīng)濟、管理、評估、欺詐、保險業(yè)及其風險、物質(zhì)基礎、數(shù)據(jù)。下面進行分別介紹。

消費金融

1.LoanAcceptance:對借貸成功率的分類和時序分析。

2.PredictLoan Repayment:使用自動特征工程預測貸款是否會被歸還

3.LoanEligibility Ranking:檢驗消費者是否具有貸款資質(zhì)的系統(tǒng)

4.HomeCredit Default:預測家庭信用違約

5.MortgageAnalytics:對按揭貸款的擴展分析

6.CreditApproval:輔助信用卡辦理申請批準的系統(tǒng)

7.LoanRisk:通過預測模型降低壞賬率,減小貸款損失

8.Amortisationschedule:用于個人使用的自動分期付款計劃

管理

1.CreditCard:對信用卡消費者進行顧客終生價值(CLV)評估

2.SurvivalAnalysis:對顧客進行生存分析

3.NextTransaction:使用深度學習模型預測下一次交易的金額和時間

4.CreditCard Churn:預測信用卡顧客流失

5.Bankof England Minutes:對英國銀行記錄的文本分析

評估

1.ZillowPrediction:預測 Zillow 公司提供的估價情況

2.RealEstate:評估城市地區(qū)的地產(chǎn)價格

3.UsedCar:二手車價格預測

欺詐

1.XGBoost:使用模擬退火算法調(diào)整 XGBoost 超參數(shù)以預測欺詐行為

2.FraudDetection loan in R:對銀行借貸的欺詐預測

3.AMLFinance Due Diligence:使用新聞進行反洗錢盡職調(diào)查

4.CreditCard Fraud:預測信用卡欺詐行為

保險業(yè)及其風險

1.BankFailure:對銀行破產(chǎn)進行預測

2.RiskManagement:關于金融業(yè)風險參與的課程資源

3.VaRGaN:使用 Keras 和 Tensorflow 評估市場風風險參與情況

4.ActuarialSciences (R):基于 R 語言的精算工具列表

物質(zhì)基礎

1.BankNote Fraud Detection:使用Tensorflow 和隨機森林對紙幣進行鑒定

2.ATMSurveillance:銀行 ATM 監(jiān)控

數(shù)據(jù)

1.EmployeeCount SEC Filings

2.SECParsing

3.OpenEdgar

4.RatingIndustries

法律法規(guī)

在該部分,作者介紹了3部分內(nèi)容的相關應用,包括工具、政策和法規(guī)、司法應用。

工具

1.LexPredict:一個相關的代碼庫

2.AIPara-legal: AI 法律助理

3.LegalEntity Detection:對法律文件的命名實體識別

4.LegalCase Summarisation:對司法判例進行文摘的多種算法匯總

5.LegalDocuments Google Scholar:使用 Google scholar 自動抽取判例

6.ChatBot:法律領域的聊天機器人和郵件通知應用

政策和法規(guī)

1.GDPRscores:依據(jù)通用數(shù)據(jù)保護條例(GDPR)對法律文件的評分進行預測

2.DrivingFactors FINRA:對美國金融監(jiān)管局(FINRA)發(fā)布限制令的影響因素分析

3.SecuritiesBias Correction:安全法規(guī)對價格影響的估計

4.PublicFirm to Legal Decision:分析上市公司對法律政策的反應

司法方面的應用

1.SuremeCourt Prediction:預測最高法院的觀念立場

2.SupremeCourt Topic Modeling:對最高法院的決定進行主題挖掘

3.JudgeOpinion:使用文本分析方法和機器學習分析法官針對某議題的觀點

4.ML LawMatching:使用機器學習匹配案例相關法律條例

5.BertMulti-label Classification:使用 AI 進行細粒度情感分析

6.SomeComputational AI Course:MIT的相關視頻課程

領域:政府和公共政策

在該部分,作者介紹了5部分內(nèi)容,包括社會政策、選舉分析、災難管理、城市規(guī)劃、設施。

社會政策

1.Triage:對政策和公共利益問題的風險建模和預測工具

2.WorldBank Poverty I:對用于貧困預測的機器學習分類算法的比較優(yōu)勢分析

3.WorldBank Poverty II:基于世界銀行數(shù)據(jù)的貧困分析

4.OverseasCompany Land Ownership:分析英國的外企情況

5.CFPB:美國消費者權(quán)益保護局(CFPB)的投訴分析

6.CannabisLegalisation Effect:關于大麻制品的法規(guī)對犯罪活動的影響分析

選舉分析

1.ElectionAnalysis:選舉分析和預測模型

2.AmericanElection Causal:使用美國國家選舉研究所(ANES)的數(shù)據(jù)構(gòu)建因果推斷模型

3.CampaignFinance and Election Results:對競選經(jīng)費和后續(xù)選舉結(jié)果間關系分析

災難管理

1.ConflictPrediction:沖突預測的相關代碼

2.BurglaryPrediciton:構(gòu)建時空模型以預測入室盜竊

3.PredictiongDisease Outbreak:基于機器學習算法的相關應用

4.Roadaccident prediction:對巴西的聯(lián)邦公路的車禍分析

5.Text Mining:使用文本挖掘進行災難管理

6.Twitterand disasters:預測 twitter是否涉及災難事件

城市規(guī)劃

1.TrafficPrediction:使用多注意力機制的循環(huán)神經(jīng)網(wǎng)絡模型對城市交通

進行時序分析

2.PredictCrashes:使用多數(shù)據(jù)來源的車禍預測模型

3.PredictHousehold Poverty:使用自動特征工程對哥斯達黎加的家庭貧困情況進行預測

設施

1.AirQuality Prediction:預測北京和倫敦在未來48小時的空氣質(zhì)量

2.WaterAccountng: 對美國的水費預算進行預測

3.ElectrcityFrench Distribution:對法國的電力數(shù)據(jù)分布進行分析

以上就是今天的分享,希望對大家有所幫助。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關注

    關注

    66

    文章

    8353

    瀏覽量

    132315
  • GitHub
    +關注

    關注

    3

    文章

    465

    瀏覽量

    16359
  • 數(shù)據(jù)科學

    關注

    0

    文章

    164

    瀏覽量

    10040

原文標題:機器學習在金融、法律等領域的技術(shù)應用 | Github推薦

文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關推薦

    9月份最熱門的機器學習開源項目TOP 5

    。github 鏈接:[https://github.com/diux-dev/imagenet18]Pypeline—創(chuàng)建并發(fā)數(shù)據(jù)管道大部分的
    發(fā)表于 10-10 13:39

    5月份Github上最熱門的數(shù)據(jù)科學機器學習項目榜單概述

    5月份Github上最熱門的數(shù)據(jù)科學機器學習項目
    發(fā)表于 07-29 06:57

    (腦控技術(shù)叢書)太赫茲科學技術(shù)和應用

    (腦控技術(shù)叢書)太赫茲科學技術(shù)和應用
    發(fā)表于 03-03 13:21

    (腦控技術(shù)叢書)太赫茲科學技術(shù)和應用

    (腦控技術(shù)叢書)太赫茲科學技術(shù)和應用
    發(fā)表于 03-06 08:02

    如何完成機器學習項目流程和數(shù)據(jù)清洗

    機器學習:完整機器學習項目流程,數(shù)據(jù)清洗
    發(fā)表于 04-26 09:31

    機器人仿真實驗

    引言機器人是當代科學技術(shù)的產(chǎn)物,是高新技術(shù)的代表。隨著微計算機技術(shù)的發(fā)展,機器科學
    發(fā)表于 09-01 06:45

    分享幾個GitHub上嵌入式相關的開源項目

    關注+星標公眾號,不錯過精彩內(nèi)容來源 | 人人都是極客大家平時學習的資源可能來自不同地方,對于程序員來說,Github上高星的開源項目值得了解并學習
    發(fā)表于 10-27 08:10

    11個機器學習開源項目

    隨著機器學習越來越受到開發(fā)者關注,出現(xiàn)了很多機器學習開源項目,
    發(fā)表于 02-14 14:25 ?2793次閱讀

    Python機器學習開源項目分析過程中的見解和趨勢

    開源技術(shù)創(chuàng)新和快速發(fā)展的核心。這篇文章向你展示Python機器學習開源項目以及
    發(fā)表于 12-16 08:56 ?732次閱讀

    什么是機器學習?機器學習能解決什么問題?(案例分析)

    隨著大數(shù)據(jù)時代的到來,機器學習成為解決問題的一種重要且關鍵的工具。不管是工業(yè)界還是學術(shù)界,機器學習
    發(fā)表于 05-18 13:13 ?1.6w次閱讀
    什么是<b class='flag-5'>機器</b><b class='flag-5'>學習</b>?<b class='flag-5'>機器</b><b class='flag-5'>學習</b>能解決什么問題?(案例分析)

    Airbnb機器學習和數(shù)據(jù)科學團隊經(jīng)驗分享

    Airbnb資深機器學習科學家Shijing Yao、前Airbnb數(shù)據(jù)科學負責人Qiang Zhu、Airbnb
    的頭像 發(fā)表于 07-07 09:24 ?3828次閱讀

    IBM與NVIDIA攜手為數(shù)據(jù)科學家拓展開源機器學習工具

    2018年10月,IBM宣布計劃將全新RAPIDS? 開源軟件納入到其企業(yè)級數(shù)據(jù)科學平臺中,涵蓋本地預置、混合云和多云環(huán)境。憑借其龐大的深度學習
    的頭像 發(fā)表于 10-20 09:43 ?2994次閱讀

    計算機科學博士進入工業(yè)界的出路在哪里?

    計算機科學涵蓋計算機體系結(jié)構(gòu)、編程語言、算法、計算和理論。其中,也包括當前火熱的人工智能與機器技術(shù)。不過,現(xiàn)在有一些討論,認為該將人工智能設定為一級學科,此處暫且表過不提??傊?,計算機科學
    的頭像 發(fā)表于 01-02 09:39 ?5305次閱讀

    GitHub發(fā)布2018機器學習年度總結(jié)報告

    24 號 GitHub 發(fā)布的官方報告 The State of the Octoverse: Machine Learning 一文中,GitHub 官方對 2018 年機器
    的頭像 發(fā)表于 01-30 15:16 ?3182次閱讀
    <b class='flag-5'>GitHub</b>發(fā)布2018<b class='flag-5'>機器</b><b class='flag-5'>學習</b>年度總結(jié)報告

    基于數(shù)據(jù)挖掘的4步工業(yè)界需求工程研究框架

    爬取數(shù)據(jù)并進行清洗,隨后根據(jù)不同的數(shù)據(jù)特點進行相似度分析和數(shù)據(jù)標注處理,最后完成數(shù)據(jù)統(tǒng)計分析。研究結(jié)果表明,國內(nèi)外工業(yè)界對需求工程的關注點各
    發(fā)表于 04-23 10:30 ?3次下載
    基于<b class='flag-5'>數(shù)據(jù)</b>挖掘的4步<b class='flag-5'>工業(yè)界</b>需求工程研究框架