0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

如何在Python中進行Elasticsearch操作?

馬哥Linux運維 ? 來源:未知 ? 作者:工程師郭婷 ? 2018-07-20 11:12 ? 次閱讀

什么是ElasticSearch?

ElasticSearch(ES)是一個建立在Apache Lucene之上的高度可用的分布式開源搜索引擎。它基于Java構(gòu)建的,因此可用于許多平臺。數(shù)據(jù)以JSON格式非結(jié)構(gòu)化存儲,這也使其成為一種NoSQL數(shù)據(jù)庫。與其他NoSQL數(shù)據(jù)庫不同,ES還提供搜索引擎功能和其他相關(guān)功能。

ElasticSearch用例

ES可用于多種目的,下面給出了其中的幾個:

你運營著提供大量動態(tài)內(nèi)容的網(wǎng)站,比如電子商務(wù)網(wǎng)站或者博客。通過實施ES,你不僅可以為Web應(yīng)用程序提供強大的搜索引擎,還可以在應(yīng)用程序中提供原生自動補全功能。

你可以獲取不同類型的日志數(shù)據(jù),然后可以使用它來查找趨勢和統(tǒng)計信息。

設(shè)置和運行

安裝ElasticSearch最簡單的方法就是下載并運行可執(zhí)行文件。必須確保使用的是Java 7或更高版本。

下載后解壓縮并運行它的二進制文件。

如何在Python中進行Elasticsearch操作?

滾動窗口中會出現(xiàn)很多文字。如果你看到像下面這樣的,那么它應(yīng)該是完成了。

如何在Python中進行Elasticsearch操作?

但是,由于眼見為實,通過cURL 查看類似于這樣的歡迎界面以便你知道確實成功安裝了:

如何在Python中進行Elasticsearch操作?

在我開始訪問Python中的Elastic Search之前,我們來做一些基本的東西。 正如我提到ES提供了一個REST API接口,我們將使用它來執(zhí)行不同的任務(wù)。

基本示例

你要做的第一件事就是創(chuàng)建索引。一切都以索引形式存儲。RDBMS概念中索引相當(dāng)于一個數(shù)據(jù)庫,因此不要將它與你在RDBMS中學(xué)習(xí)的典型索引概念混淆。使用PostMan來運行REST API。

如何在Python中進行Elasticsearch操作?

如果它成功運行,你會看到如下所示的回應(yīng):

如何在Python中進行Elasticsearch操作?

所以我們使用company為名創(chuàng)建了一個數(shù)據(jù)庫。換句話說,我們創(chuàng)建了一個名為“company”的索引。你將看到如下所示的內(nèi)容:

如何在Python中進行Elasticsearch操作?

暫時不用管mappings是什么,我們會在后面討論它。它實際上做的只是創(chuàng)建一個你自己的Schema文檔。creation_date是不言自明的。number_of_shards表示將保留此索引數(shù)據(jù)的分區(qū)數(shù)量。將整個數(shù)據(jù)保存在單個磁盤上毫無意義。如果你運行的是多個Elastic節(jié)點的集群,那么整個數(shù)據(jù)都會被分割。簡而言之,如果有5個分片,則整個數(shù)據(jù)可以在5個分片中使用,并且ElasticSearch集群可以服務(wù)來自其任何節(jié)點的請求。

副本討論的是你的數(shù)據(jù)的鏡像。如果你熟悉主從概念,那么這對你來說不應(yīng)該是新事物。你可以了解更多關(guān)于基本ES概念。

創(chuàng)建索引的cURL版本是單線程的。

如何在Python中進行Elasticsearch操作?

你也可以一次執(zhí)行索引創(chuàng)建和記錄插入任務(wù)。你所要做的就是以JSON格式傳遞你的記錄。你可以在PostMan中使用下面的東西:

如何在Python中進行Elasticsearch操作?

請確保你將Content-Type設(shè)置為application/json.

一個名為company的索引會被創(chuàng)建如果它原本不存在的話,然后在這里創(chuàng)建一個名為employees的新類型。Type實際上是RDBMS中的表的ES版本。

上述請求將輸出以下JSON結(jié)構(gòu):

如何在Python中進行Elasticsearch操作?

你傳遞/1作為你的記錄的ID,但這是不必要的。它所做的只是將_id字段設(shè)置為值1,然后數(shù)據(jù)以JSON格式傳遞,最終作為新記錄或文檔插入。

如何在Python中進行Elasticsearch操作?

你可以看到元和實際記錄。

cURL版本將是:

如何在Python中進行Elasticsearch操作?

如果你想更新該記錄怎么辦?這很簡單。你所要做的就是改變你的JSON記錄。如下所示:

如何在Python中進行Elasticsearch操作?

它會生成以下輸出:

如何在Python中進行Elasticsearch操作?

注意現(xiàn)在_result字段設(shè)置為updated而不是created。

當(dāng)然,你也可以刪除某些記錄。

如何在Python中進行Elasticsearch操作?

如果你瘋了,或者你的女朋友甩了你,你可以通過從命令行運行curl -XDELETE localhost:9200/_all來毀掉整個世界。

讓我們做一些基本的搜索。 它將搜索employees類型下的所有字段并返回相關(guān)記錄。

如何在Python中進行Elasticsearch操作?

max_score字段表示記錄的相關(guān)性,即記錄的最高分?jǐn)?shù)。如果有多個記錄,那么它會是一個不同的數(shù)字。

你還可以通過傳遞字段名稱將搜索條件限制到某個字段。

我剛剛介紹了基本的例子。ES可以做很多事情,但是希望你自己通過閱讀文檔來進一步探索它,而我將繼續(xù)介紹在Python中使用ES。

在Python中使用ElasticSearch

說實話,ES的REST API已經(jīng)足夠好了,可以讓你使用requests庫執(zhí)行所有任務(wù)。不過,你可以使用ElasticSearch的Python庫專注于主要任務(wù),而不必?fù)?dān)心如何創(chuàng)建請求。

通過pip安裝它,然后你可以在你的Python程序中訪問它。

如何在Python中進行Elasticsearch操作?

為確保它的安裝正確,請從命令行運行以下基本片段:

如何在Python中進行Elasticsearch操作?

網(wǎng)頁搜索和Elasticsearch

我們來討論一下使用Elasticsearch的一些實際用例。我們的目標(biāo)是訪問在線食譜并將它們存儲在Elasticsearch中以用于搜索和分析。我們將首先從Allrecipes中獲取數(shù)據(jù)并將其存儲在ES中。我們還將創(chuàng)建一個嚴(yán)格的模式或映射,以便我們確保數(shù)據(jù)以正確的格式和類型進行索引。最后只要列出沙拉食譜的清單。我們開始吧!

獲取數(shù)據(jù)

如何在Python中進行Elasticsearch操作?

如何在Python中進行Elasticsearch操作?

所以這是獲取數(shù)據(jù)的基本程序。因為我們需要JSON格式的數(shù)據(jù),所以我對其進行了相應(yīng)的轉(zhuǎn)換。

創(chuàng)建索引

我們得到了所需的數(shù)據(jù),接下來我們必須存儲它。我們要做的第一件事就是創(chuàng)建一個索引。讓我們將其命名為recipes。 該類型將被稱為salads。我要做的另一件事是創(chuàng)建我們的文檔結(jié)構(gòu)的映射。

在我們創(chuàng)建索引之前,我們必須連接ElasticSearch服務(wù)器。

如何在Python中進行Elasticsearch操作?

如何在Python中進行Elasticsearch操作?

這里有很多要說的事。首先,我們傳遞了一個包含整個文檔結(jié)構(gòu)映射的配置變量。映射是模式這一術(shù)語在Elastic的版本。就像我們在表格中設(shè)置特定的字段數(shù)據(jù)類型一樣,我們在這里做類似的事情。檢查文檔,它涵蓋的不僅僅是這些。所有字段都是文本類型,但是calories類型為Integer。

接下來,我確保索引不存在,然后創(chuàng)建它。參數(shù)ignore = 400在檢查后不再需要,但存在性證明是必要的,因為這可以防止錯誤地覆蓋現(xiàn)有索引。雖然這很危險。這就像覆蓋數(shù)據(jù)庫。

如果索引成功創(chuàng)建,你可以驗證它,它會輸出如下所示的內(nèi)容:

如何在Python中進行Elasticsearch操作?

通過傳遞dynamic:strict我們使Elasticsearch嚴(yán)格檢查任何傳入的文檔。在這里,salads實際上是文檔類型。Type實際上是Elasticsearch對RDBMS表的回答。

記錄索引

下一步是存儲實際的數(shù)據(jù)或文檔。

如何在Python中進行Elasticsearch操作?

運行它,你會看到:

如何在Python中進行Elasticsearch操作?

你能猜到為什么會這樣嗎?由于我們沒有在我們的映射中設(shè)置ingredients,因此ES不允許我們存儲包含ingredients字段的文檔?,F(xiàn)在你知道事先分配映射的優(yōu)勢了。你可以通過這樣做避免破壞數(shù)據(jù)?,F(xiàn)在,讓我們稍微修改一下映射,現(xiàn)在看起來如下所示:

如何在Python中進行Elasticsearch操作?

我們添加nested類型的ingrdients,然后分配內(nèi)部字段的數(shù)據(jù)類型,即在我們的案例中的text。

nested數(shù)據(jù)類型允許設(shè)置嵌套的JSON對象的類型。再次運行它,你將看到以下輸出:

如何在Python中進行Elasticsearch操作?

由于你根本沒有傳遞_id,因此ES本身為存儲的文檔分配了一個動態(tài)ID。 我使用Chrome,借助名為ElasticSearch Toolbox的工具使用ES數(shù)據(jù)查看器來查看數(shù)據(jù)。

如何在Python中進行Elasticsearch操作?

在我們繼續(xù)之前,讓我們在calories字段中發(fā)送一個字符串,看看它是如何發(fā)生的。請記住,我們已將其設(shè)置為整數(shù)。 在編制索引時出現(xiàn)以下錯誤:

如何在Python中進行Elasticsearch操作?

所以現(xiàn)在你知道為文檔分配一個映射的好處了。如果你不這樣做,它仍然會工作,因為Elasticsearch將在運行時分配它自己的映射。

查詢記錄

現(xiàn)在,記錄被編入索引,是時候根據(jù)我們的需要查詢它們了。我將創(chuàng)建一個名為search()的函數(shù),它將顯示我們的查詢結(jié)果。

如何在Python中進行Elasticsearch操作?

這是非常基本的。 你在其中傳遞索引和搜索條件。讓我們嘗試一些查詢。

如何在Python中進行Elasticsearch操作?

如何在Python中進行Elasticsearch操作?

如何在Python中進行Elasticsearch操作?

如果你想獲得卡路里超過20的記錄怎么辦?

如何在Python中進行Elasticsearch操作?

你也可以指定想要返回的列或字段。上述查詢將返回卡路里大于20的所有記錄。此外,它將僅在_source下顯示title字段。

結(jié)論

Elasticsearch是一個功能強大的工具,它可以提供強大的功能幫助你來返回最準(zhǔn)確的結(jié)果集,從而使你現(xiàn)有的或新的應(yīng)用程序可搜索。我剛剛講述了它的要點,你可以繼續(xù)閱讀文檔并熟悉這個強大的工具。尤其是模糊搜索功能非常棒。如果我有機會,我會在即將發(fā)布的帖子中介紹Query DSL。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • JAVA
    +關(guān)注

    關(guān)注

    19

    文章

    2943

    瀏覽量

    104096
  • 引擎
    +關(guān)注

    關(guān)注

    1

    文章

    353

    瀏覽量

    22451
  • python
    +關(guān)注

    關(guān)注

    53

    文章

    4753

    瀏覽量

    84075

原文標(biāo)題:在Python中使用Elasticsearch

文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運維】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏

    評論

    相關(guān)推薦

    何在ADS中進行EM仿真

    先生,我想對90度支線耦合器進行EM仿真,我不知道如何在ADS中進行EM仿真。請有人知道EM模擬的PDF幫助文檔。你告訴我了嗎 以上來自于谷歌翻譯 以下為原文Sir, I want to do
    發(fā)表于 12-27 16:28

    docker安裝Elasticsearch操作指南

    docker安裝Elasticsearch以及分詞器
    發(fā)表于 09-16 16:53

    何在Arduino中進行編程

    接上篇關(guān)于Arduino基礎(chǔ)環(huán)境配置、界面介紹和C語言基礎(chǔ),這一篇的內(nèi)容為具體如何在Arduino中進行編程。在VSCode上配置Arduino什么是VSCodeVSCode,即Visual
    發(fā)表于 07-13 09:07

    何在ROBOGUIDE環(huán)境中進行離線編程和仿真?

    何在ROBOGUIDE環(huán)境中進行離線編程和仿真?如何學(xué)習(xí)FANUC Robot編程?
    發(fā)表于 09-18 06:33

    何在STM32CubeMX中進行串口通信的配置?

    何在STM32CubeMX中進行串口通信的配置?
    發(fā)表于 12-13 06:27

    何在STM32CubeMX中進行串口通信的配置?

    何在STM32CubeMX中進行串口通信的配置?
    發(fā)表于 02-18 07:34

    何在android中進行驅(qū)動呢

    何在android中進行驅(qū)動呢?并輸出dev和sys中的界面用程序調(diào)用呢?
    發(fā)表于 03-02 09:53

    何在PADS 3D Layout中進行命令操作

    了解如何在 PADS 3D Layout 中對您的 PCB 使用“Measure Distance”和“Measure Minimum Distance”命令。
    的頭像 發(fā)表于 05-15 06:05 ?4979次閱讀
    如<b class='flag-5'>何在</b>PADS 3D Layout<b class='flag-5'>中進行</b>命令<b class='flag-5'>操作</b>

    何在環(huán)境安裝使用Python操作word

    ,也有少許情況會用到讀操作,在本次教程中都會進行講解,本次課程主要用到以下4個庫,請大家提前安裝。 升級pip(便于安裝最新庫) python -m pip install -U pip
    的頭像 發(fā)表于 09-05 15:13 ?2015次閱讀
    如<b class='flag-5'>何在</b>環(huán)境安裝使用<b class='flag-5'>Python</b><b class='flag-5'>操作</b>word

    何在python代碼中使用HTTP代理IP

    何在python代碼中使用HTTP代理IP。
    的頭像 發(fā)表于 08-04 15:46 ?1181次閱讀

    Python中進程的操作

    進程是計算機中的程序關(guān)于某數(shù)據(jù)集合的一次運行活動,是系統(tǒng)進行資源分配和調(diào)度的基本單位,是操作系統(tǒng)結(jié)構(gòu)的基礎(chǔ)。
    的頭像 發(fā)表于 08-19 09:45 ?1140次閱讀
    <b class='flag-5'>Python</b><b class='flag-5'>中進</b>程的<b class='flag-5'>操作</b>

    Python對txt進行讀寫操作

    Python對txt進行讀寫操作
    的頭像 發(fā)表于 01-11 15:16 ?739次閱讀

    python列表序列操作教程

    python列表也是序列對象,可以進行序列通用的操作,類似字符串序列的操作
    的頭像 發(fā)表于 02-23 15:04 ?552次閱讀

    Python 更新 Elasticsearch 的幾種方法

    今天總結(jié)一下通過 Python 更新 Elasticsearch 數(shù)據(jù)的幾個方法 Elasticsearch 是一個實時的分布式搜索分析引擎,它能讓你以前所未有的速度和規(guī)模,去探索你的數(shù)據(jù)。它被用作
    的頭像 發(fā)表于 11-01 10:11 ?973次閱讀
    <b class='flag-5'>Python</b> 更新 <b class='flag-5'>Elasticsearch</b> 的幾種方法

    何在Python中使用Scapy進行抓包操作

    文章將介紹如何使用 Python進行簡單的抓包操作。 2. Python 中的抓包庫 在 Python 中,有很多優(yōu)秀的抓包庫,例如 S
    的頭像 發(fā)表于 11-01 14:47 ?3530次閱讀