【導語】隨著機器學習和數(shù)據(jù)科學的不斷發(fā)展,相關技術(shù)在越來越多的領域得到了應用,機器學習、數(shù)據(jù)科學和其他學科的結(jié)合已經(jīng)成為了必然趨勢。在本文中,我們給大家分享了一個包含機器學習和數(shù)據(jù)科學技術(shù)在工業(yè)界開源應用的 Github 項目,具體領域包括會計、銀行和保險業(yè)務、法律和法規(guī)、政府和公共政策等等。該項目仍在持續(xù)更新中。
隨著機器學習和數(shù)據(jù)科學技術(shù)的不斷發(fā)展,在工業(yè)界出現(xiàn)了越來越多的相關技術(shù)應用,學科交叉已經(jīng)成為必然趨勢。
在今天的分享中,營長為大家選取了一個來自GitHub的項目,該項目整理了機器學習和數(shù)據(jù)科學在工業(yè)界的落地應用,應用領域包括會計、銀行和保險業(yè)務、法律和法規(guī)、政府和公共政策等領域。在該項目中,除非特別注明,作者分享的大部分項目都基于 Python 。另外,為了使得項目代碼更具參考性,該項目列表沒有包含明確聲明“不再更新”或者已超出2年未更新的相關項目。
先為大家梳理了一下該項目的相關內(nèi)容,以便大家快速查看。如果希望進一步了解相關內(nèi)容,可查看文末的 GitHub 項目地址。
在該項目中,作者嘗試對機器學習和數(shù)據(jù)科學在工業(yè)界的具體應用情況進行匯總,預計包含的領域如下表:
目前,作者已經(jīng)整理了會計、銀行和保險業(yè)務、法律和法規(guī)、政府和公共政策四個領域的相關開源項目情況,并進行了歸納和匯總。對于每個領域,作者對相關資源進行了分類和項目匯總,并給出了每個項目的鏈接和簡短介紹。該項目列表仍在持續(xù)更新中。
領域:會計
作者將會計相關的應用劃分為7類,包括機器學習、數(shù)據(jù)分析、文本分析、數(shù)據(jù)獲取與處理、相關研究和文章、網(wǎng)站、課程。下面對各部分進行分別介紹。
機器學習
1.Chartof Account Prediction:使用帶標簽的數(shù)據(jù)集預測每筆交易的賬戶名稱。
2.AccountingAnomalies:使用深度學習框架識別會計信息中的異常。
3.FinancialStatement Anomalies:基于 R語言,在會計文件歸檔前檢測會計異常信息。
4.UsefulLife Prediction:使用傳感器數(shù)據(jù)和特征工程預測資產(chǎn)的可使用年限。
5.AI Applied to XBRL:將可擴展商業(yè)報告語言(XBRL)用于 AI 和機器學習。
數(shù)據(jù)分析
1.ForensicAccounting:包含使用數(shù)據(jù)分析手段進行法務會計的案例研究集合。
2.GeneralLedger:對會計系統(tǒng)中的總賬進行數(shù)據(jù)處理。
3.BulletGraph:以子彈圖(bullet graph)形式對銷售、委托及其他會計活動進行可視化。
4.AgedDebtors:對長期債務人的案例分析。
5.AutomatedFS XBRL:自動生成 XBRL ,也可使用 python 格式輸出。
文本分析
1.FinancialSentiment Analysis:對交易信息進行情感分析、距離分析和交易份額分析。
2.Extensive NLP:針對會計研究的 NLP 技術(shù)匯總。
數(shù)據(jù),句法分析和 APIs
1.EDGAR:獲取電子化數(shù)據(jù)收集、分析及檢索系統(tǒng)(EDGAR)數(shù)據(jù)的指南。
2.IRS:獲取美國國家稅務局(IRS)歸檔數(shù)據(jù)并進行句法分析的指南。
3.FinancialCorporate:羅格斯大學提供的金融數(shù)據(jù)集
4.Non-financialCorporate:羅格斯大學提供的非金融公司數(shù)據(jù)集
5.PDFParsing:從 PDF 文件中抽取有用信息
6.PDFTabel to Excel:從 PDF 文件中輸出表格
研究和文章
1.UnderstandingAccounting Analytics:介紹了會計分析的重要性。
2.VLFeat:一個計算機視覺算法的開源庫,并且提供了 Matlab 工具。
網(wǎng)站
1.RutgersRaw:羅格斯大學的數(shù)字會計研究
課程
1.ComputerAugmented Accounting:羅格斯大學的系列視頻課程,主要講解如何將計算機手段應用到會計中。
2.Accountingin a Digital Era:羅格斯大學的系列視頻課程,主要講解數(shù)字時代對會計的影響。
領域:銀行和保險業(yè)
作者將該領域歸納為7部分內(nèi)容,包括消費經(jīng)濟、管理、評估、欺詐、保險業(yè)及其風險、物質(zhì)基礎、數(shù)據(jù)。下面進行分別介紹。
消費金融
1.LoanAcceptance:對借貸成功率的分類和時序分析。
2.PredictLoan Repayment:使用自動特征工程預測貸款是否會被歸還
3.LoanEligibility Ranking:檢驗消費者是否具有貸款資質(zhì)的系統(tǒng)
4.HomeCredit Default:預測家庭信用違約
5.MortgageAnalytics:對按揭貸款的擴展分析
6.CreditApproval:輔助信用卡辦理申請批準的系統(tǒng)
7.LoanRisk:通過預測模型降低壞賬率,減小貸款損失
8.Amortisationschedule:用于個人使用的自動分期付款計劃
管理
1.CreditCard:對信用卡消費者進行顧客終生價值(CLV)評估
2.SurvivalAnalysis:對顧客進行生存分析
3.NextTransaction:使用深度學習模型預測下一次交易的金額和時間
4.CreditCard Churn:預測信用卡顧客流失
5.Bankof England Minutes:對英國銀行記錄的文本分析
評估
1.ZillowPrediction:預測 Zillow 公司提供的估價情況
2.RealEstate:評估城市地區(qū)的地產(chǎn)價格
3.UsedCar:二手車價格預測
欺詐
1.XGBoost:使用模擬退火算法調(diào)整 XGBoost 超參數(shù)以預測欺詐行為
2.FraudDetection loan in R:對銀行借貸的欺詐預測
3.AMLFinance Due Diligence:使用新聞進行反洗錢盡職調(diào)查
4.CreditCard Fraud:預測信用卡欺詐行為
保險業(yè)及其風險
1.BankFailure:對銀行破產(chǎn)進行預測
2.RiskManagement:關于金融業(yè)風險參與的課程資源
3.VaRGaN:使用 Keras 和 Tensorflow 評估市場風風險參與情況
4.ActuarialSciences (R):基于 R 語言的精算工具列表
物質(zhì)基礎
1.BankNote Fraud Detection:使用Tensorflow 和隨機森林對紙幣進行鑒定
2.ATMSurveillance:銀行 ATM 監(jiān)控
數(shù)據(jù)
1.EmployeeCount SEC Filings
2.SECParsing
3.OpenEdgar
4.RatingIndustries
法律法規(guī)
在該部分,作者介紹了3部分內(nèi)容的相關應用,包括工具、政策和法規(guī)、司法應用。
工具
1.LexPredict:一個相關的代碼庫
2.AIPara-legal: AI 法律助理
3.LegalEntity Detection:對法律文件的命名實體識別
4.LegalCase Summarisation:對司法判例進行文摘的多種算法匯總
5.LegalDocuments Google Scholar:使用 Google scholar 自動抽取判例
6.ChatBot:法律領域的聊天機器人和郵件通知應用
政策和法規(guī)
1.GDPRscores:依據(jù)通用數(shù)據(jù)保護條例(GDPR)對法律文件的評分進行預測
2.DrivingFactors FINRA:對美國金融監(jiān)管局(FINRA)發(fā)布限制令的影響因素分析
3.SecuritiesBias Correction:安全法規(guī)對價格影響的估計
4.PublicFirm to Legal Decision:分析上市公司對法律政策的反應
司法方面的應用
1.SuremeCourt Prediction:預測最高法院的觀念立場
2.SupremeCourt Topic Modeling:對最高法院的決定進行主題挖掘
3.JudgeOpinion:使用文本分析方法和機器學習分析法官針對某議題的觀點
4.ML LawMatching:使用機器學習匹配案例相關法律條例
5.BertMulti-label Classification:使用 AI 進行細粒度情感分析
6.SomeComputational AI Course:MIT的相關視頻課程
領域:政府和公共政策
在該部分,作者介紹了5部分內(nèi)容,包括社會政策、選舉分析、災難管理、城市規(guī)劃、設施。
社會政策
1.Triage:對政策和公共利益問題的風險建模和預測工具
2.WorldBank Poverty I:對用于貧困預測的機器學習分類算法的比較優(yōu)勢分析
3.WorldBank Poverty II:基于世界銀行數(shù)據(jù)的貧困分析
4.OverseasCompany Land Ownership:分析英國的外企情況
5.CFPB:美國消費者權(quán)益保護局(CFPB)的投訴分析
6.CannabisLegalisation Effect:關于大麻制品的法規(guī)對犯罪活動的影響分析
選舉分析
1.ElectionAnalysis:選舉分析和預測模型
2.AmericanElection Causal:使用美國國家選舉研究所(ANES)的數(shù)據(jù)構(gòu)建因果推斷模型
3.CampaignFinance and Election Results:對競選經(jīng)費和后續(xù)選舉結(jié)果間關系分析
災難管理
1.ConflictPrediction:沖突預測的相關代碼
2.BurglaryPrediciton:構(gòu)建時空模型以預測入室盜竊
3.PredictiongDisease Outbreak:基于機器學習算法的相關應用
4.Roadaccident prediction:對巴西的聯(lián)邦公路的車禍分析
5.Text Mining:使用文本挖掘進行災難管理
6.Twitterand disasters:預測 twitter是否涉及災難事件
城市規(guī)劃
1.TrafficPrediction:使用多注意力機制的循環(huán)神經(jīng)網(wǎng)絡模型對城市交通
進行時序分析
2.PredictCrashes:使用多數(shù)據(jù)來源的車禍預測模型
3.PredictHousehold Poverty:使用自動特征工程對哥斯達黎加的家庭貧困情況進行預測
設施
1.AirQuality Prediction:預測北京和倫敦在未來48小時的空氣質(zhì)量
2.WaterAccountng: 對美國的水費預算進行預測
3.ElectrcityFrench Distribution:對法國的電力數(shù)據(jù)分布進行分析
以上就是今天的分享,希望對大家有所幫助。
-
機器學習
+關注
關注
66文章
8353瀏覽量
132315 -
GitHub
+關注
關注
3文章
465瀏覽量
16359 -
數(shù)據(jù)科學
+關注
關注
0文章
164瀏覽量
10040
原文標題:機器學習在金融、法律等領域的技術(shù)應用 | Github推薦
文章出處:【微信號:rgznai100,微信公眾號:rgznai100】歡迎添加關注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
相關推薦
評論