0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

大數(shù)據(jù)公司數(shù)據(jù)分析取數(shù)流程以及SQL示例

MobTech科技派 ? 來(lái)源:MobTech科技派 ? 作者:MobTech科技派 ? 2023-06-05 17:28 ? 次閱讀

有效的數(shù)據(jù)分析,首先需要從龐大的數(shù)據(jù)庫(kù)中獲取所需的數(shù)據(jù),這就涉及到SQL取數(shù)的技巧。

SQL使用流程

作為一種結(jié)構(gòu)化查詢語(yǔ)言,SQL可以對(duì)關(guān)系型數(shù)據(jù)庫(kù)進(jìn)行增刪改查操作。對(duì)于數(shù)據(jù)分析師,最常用的就是查詢操作,即從數(shù)據(jù)庫(kù)中提取出滿足條件的數(shù)據(jù),以便再進(jìn)行計(jì)算處理或可視化展示。那么,SQL取數(shù)的基本流程是什么呢?

首先,確定要取數(shù)的目標(biāo)表和字段,以及要計(jì)算的指標(biāo)。這需要對(duì)業(yè)務(wù)需求有清晰的理解,知道要從哪些表中獲取哪些字段,以及要計(jì)算哪些內(nèi)容。

其次,編寫SQL查詢語(yǔ)句,使用select、from、where、group by、having、order by子句,指定要查詢的字段名、表名、條件、分組、排序,熟練掌握SQL語(yǔ)法,靈活使用各種函數(shù)。

然后,運(yùn)行SQL查詢語(yǔ)句,從數(shù)據(jù)庫(kù)中獲取數(shù)據(jù),一定要嚴(yán)格檢查數(shù)據(jù)的準(zhǔn)確性和完整性。正確地連接數(shù)據(jù)庫(kù),執(zhí)行查詢語(yǔ)句,還要注意檢查數(shù)據(jù)是否有缺失、異?;蝈e(cuò)誤等問題。

最后,將查詢結(jié)果導(dǎo)出到其他工具或平臺(tái),準(zhǔn)備下一步的處理或展示。不同的場(chǎng)景,配合不同的工具,普遍的如Excel、Power BI、Tableau。

SQL具體代碼內(nèi)容

具體的業(yè)務(wù)需求決定如何寫SQL代碼,但總的來(lái)說(shuō),分為以下幾個(gè)部分:

建表語(yǔ)句:創(chuàng)建數(shù)據(jù)庫(kù)或表,指定表名、字段名、字段類型、主鍵、索引等屬性。

插入語(yǔ)句:向表中插入數(shù)據(jù),指定要插入的表名和字段值。

查詢語(yǔ)句:從表中查詢數(shù)據(jù),指定要查詢的字段名、表名、條件、排序、分組等。

更新語(yǔ)句:修改表中的數(shù)據(jù),指定要修改的表名、字段名、條件和新值。

刪除語(yǔ)句:刪除表中的數(shù)據(jù),指定要?jiǎng)h除的表名和條件。

不同部分的SQL簡(jiǎn)單示例如下:

-- 建表語(yǔ)句create table products (prod_id int primary key, -- 產(chǎn)品編號(hào)prod_name varchar(50) not null, -- 產(chǎn)品名稱prod_price decimal(10,2) check (prod_price > 0), -- 產(chǎn)品價(jià)格prod_category varchar(20) -- 產(chǎn)品類別);-- 插入語(yǔ)句insert into products values (1, 'iPhone 14', 6999.00, '手機(jī)');insert into products values (2, 'iPad Pro', 4999.00, '平板');insert into products values (3, 'MacBook Air', 7999.00, '筆記本');-- 查詢語(yǔ)句select * from products; -- 查詢所有產(chǎn)品信息select prod_name, prod_price from products where prod_category = '手機(jī)'; -- 查詢手機(jī)類別的產(chǎn)品名稱和價(jià)格select prod_category, avg(prod_price) as avg_price from products group by prod_category; -- 查詢每個(gè)類別的產(chǎn)品平均價(jià)格-- 更新語(yǔ)句update products set prod_price = prod_price * 0.9 where prod_id = 1; -- 將產(chǎn)品編號(hào)為1的產(chǎn)品價(jià)格打九折-- 刪除語(yǔ)句delete from products where prod_price < 5000; -- 刪除價(jià)格低于5000的產(chǎn)品

SQL代碼示例

再看一個(gè)簡(jiǎn)單的示例,假設(shè)我們要從一個(gè)產(chǎn)品表中獲取產(chǎn)品名稱、價(jià)格和類別等信息,并計(jì)算每個(gè)類別的產(chǎn)品平均價(jià)格。

首先,我們確定要取數(shù)的目標(biāo)表和字段如下:

目標(biāo)表:products

目標(biāo)字段:prod_name(產(chǎn)品名稱)、prod_price(產(chǎn)品價(jià)格)、prod_category(產(chǎn)品類別)

目標(biāo)指標(biāo):prod_category_avg_price(每個(gè)類別的產(chǎn)品平均價(jià)格)

其次,我們編寫SQL查詢語(yǔ)句如下:

-- 查詢語(yǔ)句select prod_name, prod_price, prod_category, avg(prod_price) over (partition by prod_category) as prod_category_avg_pricefrom products;

其中,

select子句指定了要查詢的字段名;

from子句指定了要查詢的表名;

avg函數(shù)用于計(jì)算平均值;

over子句用于指定窗口函數(shù)的分區(qū)和排序方式;

partition by子句用于按照產(chǎn)品類別進(jìn)行分組;

as子句用于給計(jì)算出來(lái)的字段起一個(gè)別名。

然后,我們運(yùn)行SQL查詢語(yǔ)句,在數(shù)據(jù)庫(kù)中獲取數(shù)據(jù),并檢查數(shù)據(jù)是否正確和完整。假設(shè)我們得到了如下的查詢結(jié)果:

prod_name prod_price prod_category prod_category_avg_price
iPhone 14 6999.00 手機(jī) 6999.00
iPad Pro 4999.00 平板 4999.00
MacBook Air 7999.00 筆記本 7999.00

我們可以看到,查詢結(jié)果中包含了我們想要的字段和指標(biāo),數(shù)據(jù)也沒有缺失或異常,因此可以認(rèn)為數(shù)據(jù)是正確和完整的。

最后,我們將查詢結(jié)果導(dǎo)出到Excel中,進(jìn)行進(jìn)一步的處理,可以對(duì)查詢結(jié)果進(jìn)行排序、篩選、分析或制作圖表等,以滿足不同的需求和場(chǎng)景。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • SQL
    SQL
    +關(guān)注

    關(guān)注

    1

    文章

    750

    瀏覽量

    43900
  • 數(shù)據(jù)分析
    +關(guān)注

    關(guān)注

    2

    文章

    1393

    瀏覽量

    33909
  • 大數(shù)據(jù)
    +關(guān)注

    關(guān)注

    64

    文章

    8805

    瀏覽量

    136992
收藏 人收藏

    評(píng)論

    相關(guān)推薦

    如何從零學(xué)大數(shù)據(jù)?

    內(nèi)容:某手機(jī)公司bug 系統(tǒng) → 傳統(tǒng)廣告怎么用大數(shù)據(jù) → 類互聯(lián)網(wǎng)電商網(wǎng)站 → 網(wǎng)站日志收集清洗系統(tǒng) → 網(wǎng)站流量統(tǒng)計(jì)分析系統(tǒng)學(xué)習(xí)目標(biāo):具備企業(yè)級(jí)大型完整項(xiàng)目開發(fā)能力,綜合運(yùn)用大數(shù)據(jù)分析
    發(fā)表于 03-01 15:41

    Quick BI助力云上大數(shù)據(jù)分析---深圳云棲大會(huì)

    之路的挑戰(zhàn)與期望 阿里巴巴作為一家大數(shù)據(jù)公司,整個(gè)集團(tuán),從上到下都在踐行數(shù)字化運(yùn)營(yíng)。在3月29日深圳云棲大會(huì)的數(shù)據(jù)分析與可視化專場(chǎng)中,阿里云產(chǎn)品專家陌停對(duì)大數(shù)據(jù)智能
    發(fā)表于 04-03 11:42

    數(shù)據(jù)分析需要的技能

    用的Excel功能也要具備,其中函數(shù)結(jié)合透視表以及VBA功能,可以幫助大數(shù)據(jù)分析師快速處理報(bào)表,實(shí)現(xiàn)快速分析業(yè)務(wù)的功能!2. 需要具備數(shù)據(jù)庫(kù)操作能力
    發(fā)表于 04-10 15:59

    大數(shù)據(jù)分析邏輯

    大數(shù)據(jù)分析邏輯,全英文,請(qǐng)勿公開
    發(fā)表于 10-08 17:08

    工業(yè)大數(shù)據(jù)分析平臺(tái)的應(yīng)用價(jià)值探討

    的地方。 工業(yè)大數(shù)據(jù)作為工業(yè)互聯(lián)網(wǎng)平臺(tái)的核心組成部分,是當(dāng)今工業(yè)轉(zhuǎn)型升級(jí)的必然選擇。大數(shù)據(jù)以及現(xiàn)在大火的人工智能技術(shù)對(duì)于傳統(tǒng)行業(yè)轉(zhuǎn)型升級(jí)可謂影響深遠(yuǎn),工業(yè)大數(shù)據(jù)分析平臺(tái)功不可沒! 那么工業(yè)大數(shù)
    發(fā)表于 11-12 15:56

    電商數(shù)據(jù)分析攻略,讓你輕松搞定數(shù)據(jù)分析!

    應(yīng)用 奧威BI電商數(shù)據(jù)分析方案廣泛應(yīng)用于電子商務(wù)市場(chǎng),比如國(guó)內(nèi)電商行業(yè)、跨境電商行業(yè)。通過分析客戶交易歷史,產(chǎn)品和服務(wù)偏好以及趨勢(shì)變化,方案幫助電子商務(wù)公司了解客戶需求,提高他們的滿意
    發(fā)表于 06-27 09:22

    Get職場(chǎng)新知識(shí):做分析,用大數(shù)據(jù)分析工具

    綜合分析。但現(xiàn)在有了大數(shù)據(jù)分析工具,一切問題都可迎刃而解。 大數(shù)據(jù)分析工具,顧名思義就是專門為分析海量數(shù)據(jù)而開發(fā)的一類工具。這類工具具有極強(qiáng)
    發(fā)表于 12-05 09:36

    什么是大數(shù)據(jù)分析大數(shù)據(jù)分析的含義與目前形式

    大數(shù)據(jù)分析可以分為大數(shù)據(jù)分析兩個(gè)方面。如今大數(shù)據(jù)已經(jīng)經(jīng)常出現(xiàn)在報(bào)紙新聞當(dāng)中,但大數(shù)據(jù)大數(shù)據(jù)分析
    發(fā)表于 10-12 14:06 ?1.6w次閱讀

    什么叫大數(shù)據(jù)分析

    大數(shù)據(jù)分析是指對(duì)規(guī)模巨大的數(shù)據(jù)進(jìn)行分析大數(shù)據(jù)可以概括為4個(gè)V, 數(shù)據(jù)量大(Volume)、速度快(Velocity)、類型多(Variet
    的頭像 發(fā)表于 11-10 09:27 ?2.8w次閱讀

    BI大數(shù)據(jù)分析系統(tǒng),大數(shù)據(jù)可視化分析平臺(tái)

    金融行業(yè),一些傳統(tǒng)行業(yè)以及電商行業(yè)以及實(shí)體行業(yè)都是可以結(jié)合BI大數(shù)據(jù)分析來(lái)做成出行業(yè)內(nèi)的數(shù)據(jù)分析,當(dāng)然也包括區(qū)塊鏈領(lǐng)域。深圳源中瑞科技有限公司
    發(fā)表于 02-13 17:57 ?1145次閱讀

    實(shí)例詳解對(duì)Serverless SQL大數(shù)據(jù)分析技術(shù)的應(yīng)用

    近年來(lái), Serverless作為一種新型的互聯(lián)網(wǎng)架構(gòu)直接或間接推動(dòng)了云計(jì)算的發(fā)展,同時(shí)基于Serverless的輕量計(jì)算也成為了新的技術(shù)熱點(diǎn),而Serverless SQL大數(shù)據(jù)分析產(chǎn)品就在此背景下應(yīng)運(yùn)而生。
    的頭像 發(fā)表于 07-26 10:54 ?4154次閱讀
    實(shí)例詳解對(duì)Serverless <b class='flag-5'>SQL</b><b class='flag-5'>大數(shù)據(jù)分析</b>技術(shù)的應(yīng)用

    大數(shù)據(jù)分析如何來(lái)增強(qiáng)

    為了應(yīng)對(duì)網(wǎng)絡(luò)安全挑戰(zhàn)和威脅,組織須改進(jìn)大數(shù)據(jù)分析。這就是大數(shù)據(jù)分析很重要的原因。
    發(fā)表于 01-26 17:56 ?1150次閱讀

    還在為大數(shù)據(jù)分析工具發(fā)愁?以下是2021最值得推薦的大數(shù)據(jù)分析工具

    一個(gè)好用的大數(shù)據(jù)分析工具,能夠提高企業(yè)整體分析研究能力、市場(chǎng)快速反應(yīng)能力。下面我為大家推薦幾款目前我認(rèn)為很好用的幾款大數(shù)據(jù)分析工具。
    的頭像 發(fā)表于 03-05 17:56 ?2017次閱讀

    什么是大數(shù)據(jù)分析

    大數(shù)據(jù)分析行業(yè)是最近這幾年比較火,比較高薪的行業(yè)了,很多人都想分一杯羹,經(jīng)常同學(xué)問我什么是大數(shù)據(jù)分析?什么是python?這些能學(xué)到什么技能?以后能學(xué)到什么知識(shí)?有太多的疑問,小編今天就簡(jiǎn)單寫出來(lái)
    的頭像 發(fā)表于 05-19 11:47 ?1140次閱讀

    廣告投放公司運(yùn)用大數(shù)據(jù)分析,實(shí)現(xiàn)精準(zhǔn)投放

    。廣告投放公司將探討廣告投放公司如何運(yùn)用大數(shù)據(jù)分析實(shí)現(xiàn)精準(zhǔn)投放,以及這一過程中的關(guān)鍵要素和挑戰(zhàn)。 一、大數(shù)據(jù)在廣告投放中的作用
    的頭像 發(fā)表于 04-11 11:23 ?532次閱讀