0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌云(Google Cloud)利用AI將照片數(shù)字化

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-11-12 10:34 ? 次閱讀

珍貴的紙質(zhì)老照片該如何保存?《紐約時(shí)報(bào)》與谷歌云合作,利用AI將19世紀(jì)以來的500-700萬張歷史照片數(shù)字化。谷歌云的AI技術(shù)不僅可以將照片數(shù)字化,還能掃描照片上的筆記,分類它們包含的位置、日期等語義信息 。

紙質(zhì)老照片記錄下了當(dāng)時(shí)的珍貴時(shí)刻,其中的歷史意義也更為重要,但紙質(zhì)極容易損壞,人類該怎么保存它們,讓它們恒久遠(yuǎn)永流傳?

谷歌云(Google Cloud)利用AI將照片數(shù)字化。

在《紐約時(shí)報(bào)》位于美國(guó)時(shí)代廣場(chǎng)辦公室附近的地下室中存放了大約500萬張到700萬張的舊照片,存在這些照片的地方名為資料檔案室。

《紐約時(shí)報(bào)》不僅存放了這些照片,也存儲(chǔ)了有關(guān)它們是何時(shí)發(fā)布及其發(fā)布原因的相關(guān)信息。現(xiàn)在,該報(bào)正在與谷歌云合作,準(zhǔn)備將其龐大的藏品數(shù)字化。

谷歌云官方發(fā)布博客稱,它將與紐約時(shí)報(bào)合作,將龐大的照片集數(shù)字化,利用谷歌云中的工具幫助《紐約時(shí)報(bào)》安全地存儲(chǔ)照片,提供更好的界面來查找照片,甚至可以通過照片背后的數(shù)字來獲得更多照片內(nèi)蘊(yùn)含的信息。

紙質(zhì)實(shí)物易腐爛,通過AI保護(hù)珍貴的視覺遺產(chǎn)

“資料檔案室保存的照片可以追溯到19世紀(jì)末期,其中許多內(nèi)容具有巨大的歷史價(jià)值——很多照片是世界上其他地方都沒有的。 2015年,一個(gè)破損的管道淹沒了檔案館 ,使整個(gè)館藏面臨風(fēng)險(xiǎn)。 幸運(yùn)的是,當(dāng)時(shí)只有輕微的損害,但這一事件引發(fā)了人們反思:這些最寶貴的實(shí)物資產(chǎn)該如何安全存儲(chǔ)?

《紐約時(shí)報(bào)》的資料檔案室

“資料檔案室是一個(gè)易腐文件的寶庫,不僅是《紐約時(shí)報(bào)》的歷史,而且是近一個(gè)多世紀(jì)以來影響我們現(xiàn)代社會(huì)的全球事件的無價(jià)編年史。”《紐約時(shí)報(bào)》新任首席技術(shù)官Nick Rockwell說。

不僅照片的圖像包含有價(jià)值的信息。 在許多情況下,照片的背面包括拍攝照片的時(shí)間和地點(diǎn)。Rockwell補(bǔ)充說:“照片部門和商業(yè)方面的工作人員多年來一直在探索將這些照片數(shù)字化的可能途徑。 但就像去年一樣,數(shù)字化存檔的想法似乎仍然遙不可及。”

《紐約時(shí)報(bào)》的老照片:1984年,蘋果創(chuàng)始人史蒂夫·喬布斯

為了保護(hù)這個(gè)無價(jià)的歷史,并讓《紐約時(shí)報(bào)》能夠通過更多的視覺敘事和歷史背景來增強(qiáng)其報(bào)道, 《紐約時(shí)報(bào)》正在對(duì)其檔案進(jìn)行數(shù)字化,使用谷歌云來存儲(chǔ)資料檔案室內(nèi)所有圖像的高分辨率掃描。

谷歌云是可用于存儲(chǔ)對(duì)象的系統(tǒng),它為紐約時(shí)報(bào)等客戶提供自動(dòng)生命周期管理,不同區(qū)域的存儲(chǔ)以及易于使用的管理界面和API。

AI工作原理:Google Cloud中的技術(shù)可以處理和識(shí)別照片中的大量信息

僅僅存儲(chǔ)高分辨率圖像不足以創(chuàng)建照片管理者可以輕松使用的系統(tǒng)。

有效的資產(chǎn)管理系統(tǒng)必須允許用戶輕松瀏覽和搜索照片。《紐約時(shí)報(bào)》建立了一個(gè)存儲(chǔ)和處理照片的處理系統(tǒng),并將使用Google Cloud中的技術(shù)處理和識(shí)別圖像中可以找到的文本、手寫內(nèi)容和其他細(xì)節(jié)。

以下它的工作原理:

將圖像提取到云存儲(chǔ)后, 《紐約時(shí)報(bào)》使用Cloud Pub / Sub啟動(dòng)處理傳輸途徑以完成多項(xiàng)任務(wù)。 通過在Google Kubernetes Engine (GKE)上運(yùn)行的服務(wù)調(diào)整圖像大小,圖像的元數(shù)據(jù)存儲(chǔ)在運(yùn)行在谷歌完全托管數(shù)據(jù)庫產(chǎn)品Cloud SQL里的PostgreSQL數(shù)據(jù)庫中。

Cloud Pub / Sub幫助《紐約時(shí)報(bào)》創(chuàng)建其處理流程,而無需構(gòu)建復(fù)雜的API或業(yè)務(wù)流程系統(tǒng)。它是一個(gè)完全托管的解決方案,因此沒有時(shí)間維護(hù)底層基礎(chǔ)架構(gòu)。

谷歌云官方發(fā)布與《紐約時(shí)報(bào)》合作將照片數(shù)字化的宣傳片,講述了AI工作原理

為了調(diào)整圖像大小和修改圖像元數(shù)據(jù), 《紐約時(shí)報(bào)》使用開源命令行程序“ImageMagick ”和“ ExifTool ”。 他們將ImageMagick和exiftool添加到Docker鏡像中,以便以最小的管理工作量、一種水平可擴(kuò)展的方式在GKE上運(yùn)行它們。 添加更多容量來處理更多圖像并不重要,當(dāng)不需要服務(wù)時(shí),《紐約時(shí)報(bào)》可以停止或啟動(dòng)其Kubernetes集群。 這些圖片還存儲(chǔ)在云存儲(chǔ)的多區(qū)域位置創(chuàng)建的存儲(chǔ)桶中,以便在多個(gè)位置提供可用性。

存檔的最后一部分是在圖像及其元數(shù)據(jù)在“紐約時(shí)報(bào)”管理系統(tǒng)中移動(dòng)時(shí)跟蹤它們。Cloud SQL是一個(gè)很好的選擇。對(duì)于開發(fā)人員,Cloud SQL提供了一個(gè)標(biāo)準(zhǔn)的PostgreSQL實(shí)例:作為完全托管的服務(wù),無需安裝新版本、應(yīng)用安全補(bǔ)丁或設(shè)置復(fù)雜配置。 Cloud SQL為開發(fā)者們提供了一種使用標(biāo)準(zhǔn)SQL解決方案的簡(jiǎn)單方法。

不只是存儲(chǔ)圖像,機(jī)器學(xué)習(xí)可以獲取照片上的很多信息

存儲(chǔ)圖像只是這個(gè)故事的一部分。

為了使像《紐約時(shí)報(bào)》資料檔案室的圖片更加便于使用,利用額外的GCP功能是有益的。 在《紐約時(shí)報(bào)》的案例中,掃描照片的更大挑戰(zhàn)是添加有關(guān)老照片的內(nèi)容數(shù)據(jù)。 Cloud Vision API可以幫助填補(bǔ)這一空白。

讓我們來看看《紐約時(shí)報(bào)》舊賓州車站的這張照片。 來看下這張照片的正面和背面。

這是一張漂亮的黑白照片,但沒有額外的背景,從照片的正面看不清楚它在講述什么。 照片背面包含大量有用信息,Cloud Vision API可以幫助我們處理、存儲(chǔ)和閱讀它的信息。 當(dāng)谷歌將圖像的背面提交給API(無需額外處理)時(shí),我們可以看到Cloud Vision API檢測(cè)到以下文本(譯者注:文本邏輯并非完全清晰,主要是照片上的碎片化內(nèi)容):

1985年11月27日

1992年7月28日

時(shí)鐘懸掛在1942年賓夕法尼亞車站主要大廳的入口上方,右側(cè)是車站外部,然后于1963年拆除。

在紐約出版

存儲(chǔ)于1972年4月30日

《紐約時(shí)報(bào)》那時(shí)賦予這張照片的意義:1942年擁擠的賓州車站,這個(gè)時(shí)代“只有勇敢的飛行 - 到華盛頓,邁阿密和各種各樣的車站?!?/p>

背面信息:

賓州車站的好日子/懷舊之旅

(OCT 3194

RAPR 20072

攝影:紐時(shí)時(shí)報(bào)工作人員,1942年,紐約人大學(xué)城的舊賓夕法尼亞電視臺(tái)。該人士在現(xiàn)在的Postellgesikha將軍那里建立了一個(gè)發(fā)電臺(tái)

Pub NYT Sun 5/2/93 Metro

THURSDAY EARLY RUN o cos x ET RESORT

EB 11 1988

RECEIVED DEC 25 1942 + ART DEPT. FILES

The New York Times Business at rail terminals is reflected in the hotels;

OUTWARD BOUND FOR THE CHRISTMAS HOLIDAYS The scene in Pennsylvania Station yesterday afternoor afternoothe New York Times (Greenhaus)

這是我們的Cloud Vision API的實(shí)際輸出,無需對(duì)圖像進(jìn)行額外的預(yù)處理。 當(dāng)然,數(shù)字文本轉(zhuǎn)錄并不完美,但它比處理數(shù)百萬張圖像的替代品更快,更具節(jié)省成本。

谷歌云:將過去帶向未來,使所有信息都變得可用

這只是個(gè)開始。 類似于《紐約時(shí)報(bào)》的公司可以使用Vision API來識(shí)別對(duì)象、地點(diǎn)和圖像。 例如,如果我們通過帶有徽標(biāo)檢測(cè)功能的Cloud Vision API傳遞上面的黑白照片,我們就可以看到賓州車站被識(shí)別出來了。

谷歌云的自然語言API可用于向已識(shí)別的文本添加其他語義信息。 例如,如果我們通過API,通過文本“紐約時(shí)報(bào)的方式 - 1942年擁擠的賓州車站,一個(gè)只有勇敢飛行的時(shí)代 - 華盛頓,邁阿密和各種各樣的車站?!闭_地將“賓州車站”,“華盛頓”和“邁阿密”識(shí)別為位置,并將整個(gè)句子分類為“旅行”類別和子類別“公共汽車和鐵路”。

谷歌云在博客中聲稱,幫助《紐約時(shí)報(bào)》改造其照片檔案完全符合谷歌的使命,即組織世界范圍內(nèi)的信息并使其普遍可用和有用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6128

    瀏覽量

    104952
  • AI
    AI
    +關(guān)注

    關(guān)注

    87

    文章

    29822

    瀏覽量

    268111
  • 數(shù)字化
    +關(guān)注

    關(guān)注

    8

    文章

    8546

    瀏覽量

    61584

原文標(biāo)題:留住老照片,谷歌用AI幫紐約時(shí)報(bào)講了500萬個(gè)故事

文章出處:【微信號(hào):AI_era,微信公眾號(hào):新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏

    評(píng)論

    相關(guān)推薦

    花旗集團(tuán)攜手谷歌,加速數(shù)字化轉(zhuǎn)型

    數(shù)字化轉(zhuǎn)型步伐。 此次遷移不僅標(biāo)志著花旗集團(tuán)在計(jì)算領(lǐng)域邁出了堅(jiān)實(shí)的一步,也體現(xiàn)了其對(duì)谷歌強(qiáng)大技術(shù)實(shí)力和廣泛服務(wù)生態(tài)的高度認(rèn)可?;ㄆ旒瘓F(tuán)
    的頭像 發(fā)表于 10-29 14:59 ?300次閱讀

    計(jì)算對(duì)企業(yè)數(shù)字化轉(zhuǎn)型的影響

    計(jì)算對(duì)企業(yè)數(shù)字化轉(zhuǎn)型的影響是多方面的,以下是對(duì)其影響的分析: 一、降低IT成本,提高資源利用效率 計(jì)算使企業(yè)能夠根據(jù)實(shí)際需求靈活調(diào)整計(jì)算資源,實(shí)現(xiàn)按需分配和使用。傳統(tǒng)的IT基礎(chǔ)設(shè)施
    的頭像 發(fā)表于 10-24 09:15 ?169次閱讀

    霍尼韋爾攜手谷歌,在工業(yè)領(lǐng)域引入生成式AI Gemini

    10月21日新聞,霍尼韋爾(Honeywell)攜手谷歌Google Cloud)達(dá)成合作,旨在生成式人工智能Gemini引入工業(yè)領(lǐng)域
    的頭像 發(fā)表于 10-23 14:20 ?224次閱讀

    高通與谷歌達(dá)成多年技術(shù)合作,共推汽車行業(yè)數(shù)字化轉(zhuǎn)型

    北京時(shí)間10月23日,高通技術(shù)公司宣布與谷歌達(dá)成一項(xiàng)為期多年的技術(shù)合作,旨在加速c行業(yè)的數(shù)字化轉(zhuǎn)型。   基于雙方長(zhǎng)期的合作關(guān)系,高通和谷歌共同
    的頭像 發(fā)表于 10-23 11:53 ?970次閱讀

    高通與谷歌攜手推動(dòng)汽車行業(yè)數(shù)字化轉(zhuǎn)型

    近日,高通技術(shù)公司與谷歌宣布了一項(xiàng)長(zhǎng)期技術(shù)合作計(jì)劃,共同致力于加速汽車行業(yè)的數(shù)字化變革。雙方依托驍龍數(shù)字底盤、安卓汽車操作系統(tǒng)(AAOS)及谷歌
    的頭像 發(fā)表于 10-23 10:51 ?291次閱讀

    高速數(shù)字化儀的技術(shù)原理和應(yīng)用場(chǎng)景

    ,數(shù)字化儀處理的信號(hào)精度就越高。在采樣過程中,高速數(shù)字化模擬信號(hào)的連續(xù)時(shí)間信號(hào)轉(zhuǎn)換為離散時(shí)間信號(hào),使其可以進(jìn)行數(shù)字信號(hào)處理。 量化:量化是
    發(fā)表于 10-21 14:34

    NetApp與Google Cloud深化合作,強(qiáng)化分布式存儲(chǔ)

    智能數(shù)據(jù)基礎(chǔ)設(shè)施領(lǐng)導(dǎo)者NetApp?宣布,其與Google Cloud的戰(zhàn)略合作再升級(jí)。此次合作中,NetApp統(tǒng)一數(shù)據(jù)存儲(chǔ)和智能服務(wù)融入Google Distributed
    的頭像 發(fā)表于 10-11 17:21 ?421次閱讀

    Persistent Systems攜手谷歌,共推全球企業(yè)數(shù)字化轉(zhuǎn)型

    在全球數(shù)字化轉(zhuǎn)型的浪潮下,企業(yè)對(duì)于高效、安全、創(chuàng)新的解決方案需求日益迫切。為滿足這一市場(chǎng)需求,全球數(shù)字工程和企業(yè)現(xiàn)代領(lǐng)域的佼佼者Persistent Systems近日宣布與谷歌
    的頭像 發(fā)表于 06-12 15:32 ?399次閱讀

    甲骨文與谷歌攜手,共創(chuàng)技術(shù)新篇章

    數(shù)字化浪潮的推動(dòng)下,計(jì)算已成為企業(yè)轉(zhuǎn)型升級(jí)的必經(jīng)之路。近日,兩大科技巨頭——甲骨文(Oracle)和谷歌Google
    的頭像 發(fā)表于 06-12 15:10 ?453次閱讀

    榮耀宣布推出搭載谷歌 Gemini AI的智能手機(jī)

    CNBC報(bào)道稱,榮耀方面透露,新品融合谷歌GeminiAI和Imagen 2圖像生成工具等生成式AI技術(shù),同時(shí)由Google Cloud
    的頭像 發(fā)表于 05-27 17:46 ?780次閱讀

    Google Cloud推出基于Arm Neoverse V2定制Google Axion處理器

    Arm Neoverse 平臺(tái)已成為服務(wù)提供商優(yōu)化其從芯片到軟件全棧的心儀之選。近日,Google Cloud 推出了基于 Arm Neoverse V2 打造的定制 Google
    的頭像 發(fā)表于 04-16 14:30 ?585次閱讀

    谷歌發(fā)布Axion新款數(shù)據(jù)中心AI芯片,性能超越x86及云端

    谷歌預(yù)計(jì)通過Google Cloud提供Axion AI芯片給客戶。谷歌強(qiáng)調(diào)這款基于ARM的C
    的頭像 發(fā)表于 04-10 16:32 ?820次閱讀

    Google Cloud 推出 TPU v5p 和 AI Hypercomputer: 支持下一代 AI 工作負(fù)載

    以下文章來源于谷歌服務(wù),作者 Google Cloud Amin Vahdat ML、系統(tǒng)與 Cloud
    的頭像 發(fā)表于 12-13 16:05 ?533次閱讀
    <b class='flag-5'>Google</b> <b class='flag-5'>Cloud</b> 推出 TPU v5p 和 <b class='flag-5'>AI</b> Hypercomputer: 支持下一代 <b class='flag-5'>AI</b> 工作負(fù)載

    Google Cloud 線上課堂 | Google Cloud 遷移最佳實(shí)踐

    以下文章來源于谷歌服務(wù),作者 Google Cloud 立即預(yù)約 長(zhǎng)按識(shí)別/掃描 右方二維碼 預(yù)約觀看直播 各行各業(yè)的組織都積極業(yè)務(wù)遷移
    的頭像 發(fā)表于 11-28 17:45 ?458次閱讀

    NVIDIA 宣布在 Microsoft Azure 上提供 Omniverse Cloud 服務(wù),加速汽車行業(yè)的數(shù)字化進(jìn)程

    驅(qū)動(dòng)的 AI 增強(qiáng)數(shù)字化系統(tǒng)。 為幫助他們節(jié)約成本并縮短交付周期,NVIDIA 在 Omniverse Cloud 上發(fā)布了兩個(gè)全新的仿真引擎:虛擬工廠仿真引擎和自動(dòng)駕駛汽車(AV)仿真引擎
    的頭像 發(fā)表于 11-16 21:10 ?485次閱讀