午夜理论在线观看无码,亚洲视频狠狠爱,全黄H全肉边做边吃奶视频

變量乘常量

常量為2的冪

乘法將會(huì)被替換為執(zhí)行周期更短的移位指令。

int fun(int n) {
    return n * 16;
}
// mov eax, n
// shl eax, 4

常量為非2的冪

因?yàn)?thumb 和 x86 指令集的差異，安卓平臺(tái)上處理的更好一些。

我并不推薦你把自己當(dāng)成編譯器，看到算式想著怎么轉(zhuǎn)成匯編，而是推薦記下這種算法，看到計(jì)算過程知道怎么轉(zhuǎn)成原式，當(dāng)然也不追求100%還原，邏輯一致即可。

編譯器會(huì)對非2的冪進(jìn)行拆解，例如：

n * 15 = n * 16 - n = n << 4 - n
n * 12 = n * 3 * 4 = (n << 1 + n) << 2

int value = n * 15;
// rsb.w r0, r1, r1, lsl #4

int value = n * 12;
// add.w r0, r1, r1, lsl #1

當(dāng)然 windows 平臺(tái)也不是一無是處，某些乘法會(huì)通過 lea 將兩條指令合并成一條。

n * 4 + 5 = lea edx, [ecx * 4 + 5]

printf("%d", n * 4 + 5);
// mov ecx, n
// lea edx, [ecx * 4 + 5]
// push edx

至于值為不可拆分的素?cái)?shù)，就改用 mul 指令。

變量乘變量

這一步?jīng)]有什么優(yōu)化空間，因?yàn)槎际俏粗模荒芾侠蠈?shí)實(shí)用 mul 指令。

int fun(int n, int m) {
    return n * m;
}
// mov eax, n
// mov ecx, m
// imul ecx

除法

在看下面內(nèi)容之前，不妨再問問自己，真的了解除法嗎？除法的本質(zhì)是什么？

ok，現(xiàn)在是復(fù)習(xí)時(shí)間，簡單總結(jié)一下以下兩個(gè)問題。

符號問題
1. 兩個(gè)無符號整數(shù)相除，結(jié)果依然是無符號
2. 兩個(gè)有符號整數(shù)相除，結(jié)果依然是有符號
3. 混除，參數(shù)全被當(dāng)成無符號計(jì)算，結(jié)果是無符號
取整問題
1. 向下取整 —— floor 函數(shù) 存在誤差 => ( - a / b ) + ( a / b ) != - ( a / b ) - ( a / b )
2. 向上取整 —— ceil 函數(shù) 存在誤差 => ( - a / b ) != - ( a / b )
3. 向零取整 —— 截?cái)喑?Truncate)，可以理解為放棄小數(shù)部分，只取整數(shù)部分，可以在任何情況保持恒等，大部分語言用的都是截?cái)喑?/li>

除數(shù)為無符號數(shù)

大數(shù)（負(fù)數(shù)）

在無符號中，負(fù)數(shù)的值是很大的，例如 -8 = 0xFFFFFFF8。

而除以這種大數(shù)，只能出現(xiàn)兩種情況，1或 0，換個(gè)思路來想就可以寫成這樣：[被除數(shù)] >= [除數(shù)] ? 1 : 0

我們來看看 thumb 下是怎么優(yōu)化的？

UINT value = (UINT)n / -8;
// cmn.w r0, #9    ; cmp r0, -9
// it hi
// movhi r1, #1    ; n > -9 ? 1 : 0

他這里做了一個(gè)小小的變形：[被除數(shù)] > [除數(shù) - 1] ? 1 : 0，邏輯上仍然成立。

2的冪

簡單的移位

UINT value = (UINT)n / 4;
// lsrs r1, r0, #2

非2的冪

接下來就要引入一個(gè)非常魔幻的設(shè)定，magic number。說來這個(gè)魔數(shù)，依稀記得早在幾年前的知乎上看到過一篇文章，講的是雷神之錘游戲引擎就使用了這么一個(gè)魔數(shù)，那時(shí)的cpu是非常低效的，而為了避免使用除法這種 cpu 周期偏長的指令，天才的程序員們想出了各種奇技淫巧，其中最為后人津津樂道的就是游戲中對平方根倒數(shù)的優(yōu)化，將計(jì)算過程等價(jià)替換為加法和移位操作，損失少量的精度來換取絕對的性能。

我們這里的魔數(shù)稍有不同，它是用來優(yōu)化除法的，而且邏輯上也相對容易理解一些，廢話不多說，進(jìn)入正題。

對于普通除法，我們可以得到以下的換算：（x => 被除數(shù)變量，c => 除數(shù)常量，M => 魔數(shù)）

假設(shè)用 M 代替 2^n / c 這個(gè) Magic 變量，于是有：

也就是說，除法將會(huì)被轉(zhuǎn)會(huì)成 (x * M) >> n 的邏輯進(jìn)行運(yùn)算，至于 M 和 n 值怎么來的，我們不關(guān)心，這是編譯器根據(jù)除數(shù)算出來的最優(yōu)值，會(huì)盡力保證偏差達(dá)到最小，我們要做的是認(rèn)出魔數(shù)和移了多少位，然后根據(jù) m = 2^n/c 公式求得原本的除數(shù) c = 2^n/m

公式來源于《C++反匯編與逆向分析技術(shù)揭秘》，真的是非常非常的細(xì)，書中整個(gè)推導(dǎo)過程很完整，很建議各位去仔細(xì)研讀一遍

以下代碼為例：

printf("%u", (unsigned)argc / 3);
// mov eax, 0xAAAAAAAB   ; M
// mul [argc]            ; edx:eax = argc * M
// shr edx, 1            ; edx = argc * M >> 32 >> 1
// push edx

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

代碼

代碼

+關(guān)注

關(guān)注
30

文章
4722

瀏覽量
68234
編譯器

編譯器

+關(guān)注

關(guān)注
1

文章
1617

瀏覽量
49015
Andorid

Andorid

+關(guān)注

關(guān)注
0

文章
7

瀏覽量
6974

如何編寫有利于編譯器優(yōu)化的代碼

對于嵌入式系統(tǒng)，最終代碼的體積和效率取決于由編譯器生成的可執(zhí)行代碼，而非開發(fā)人員編寫的源代碼；但是源代碼的

發(fā)表于 11-09 10:31 ?1399次閱讀

如何編寫有利于<b class='flag-5'>編譯器</b><b class='flag-5'>優(yōu)化</b>的<b class='flag-5'>代碼</b>

如何編寫有利于編譯器優(yōu)化的代碼

本篇文章將以國際知名編譯器廠商IAR Systems的編譯器為例，來解答開發(fā)人員在實(shí)際工作中常常遇到的問題，工程師朋友們可以在IAR編譯器上進(jìn)行實(shí)踐驗(yàn)證。

發(fā)表于 08-01 09:43 ?466次閱讀

如何編寫有利于編譯器優(yōu)化的代碼

啟發(fā)式的方法，經(jīng)驗(yàn)表明，一些代碼轉(zhuǎn)換往往會(huì)產(chǎn)生更好的代碼，或者開拓出進(jìn)一步編譯優(yōu)化的空間。編譯優(yōu)化

發(fā)表于 11-21 08:00

如何編寫有利于編譯器優(yōu)化的代碼

啟發(fā)式的方法，經(jīng)驗(yàn)表明，一些代碼轉(zhuǎn)換往往會(huì)產(chǎn)生更好的代碼，或者開拓出進(jìn)一步編譯優(yōu)化的空間。編譯優(yōu)化

發(fā)表于 04-11 10:17

SIMD計(jì)算機(jī)的優(yōu)化編譯器設(shè)計(jì)

利用處理器的相關(guān)資源，提高編譯器優(yōu)化性能和增強(qiáng)代碼可適應(yīng)性是SIMD處理器優(yōu)化

發(fā)表于 04-03 08:47 ?30次下載

Keil C編譯器編程規(guī)則和代碼優(yōu)化

本內(nèi)容介紹了Keil C編譯器編程規(guī)則和代碼優(yōu)化，要實(shí)用好單片機(jī)就必須清楚它的內(nèi)部結(jié)構(gòu)組織結(jié)構(gòu)，無論是在芯片的選擇還是代碼的編寫

發(fā)表于 04-20 17:37 ?315次下載

編譯器_keil的優(yōu)化選項(xiàng)問題

keil編譯器的優(yōu)化選項(xiàng)針對ARM，對STM32編譯的一些優(yōu)化的問題

發(fā)表于 02-25 14:18 ?3次下載

C編譯器及其優(yōu)化

本章將幫助讀者在ARM處理器上編寫高效的C代碼。本章涉及的一些技術(shù)不僅適用于ARM處理器，也適用于其他RISC處理器。本章首先從ARM編譯器

發(fā)表于 10-17 17:22 ?2次下載

如何使用編譯器進(jìn)行定位優(yōu)化信息

在本次網(wǎng)絡(luò)研討會(huì)中，我們將向您展示如何使用編譯器選項(xiàng)來定位您正在尋找的確切優(yōu)化信息以及如何使用此信息來加速你的申請。

發(fā)表于 11-01 06:50 ?2585次閱讀

編譯器優(yōu)化對函數(shù)的影響

編譯器如gcc，可以指定不同的優(yōu)化參數(shù)，在某些條件下，有些函數(shù)可能會(huì)被優(yōu)化掉。

發(fā)表于 06-22 14:58 ?2790次閱讀

CompCert編譯器目標(biāo)代碼生成機(jī)制研究綜述

對 Compcert編譯器目標(biāo)代碼生成機(jī)制進(jìn)行剖析，主要介紹其設(shè)計(jì)邏輯、翻譯過程、語義保持性以及代碼結(jié)構(gòu)，并給出了 Compcert編譯器重

發(fā)表于 05-07 10:17 ?4次下載

如何編寫有利于編譯器優(yōu)化的代碼

對于嵌入式系統(tǒng)，最終代碼的體積和效率取決于由編譯器生成的可執(zhí)行代碼，而非開發(fā)人員編寫的源代碼；但是源代碼的

發(fā)表于 03-29 15:58 ?1458次閱讀

編譯器如何對代碼進(jìn)行優(yōu)化（上）

在學(xué)習(xí) Andorid 逆向的過程中，發(fā)現(xiàn)無論是哪種編譯器，生成哪個(gè)平臺(tái)的代碼，其優(yōu)化思路在本質(zhì)上如出一轍，在 Windwos 平臺(tái)所使用的技巧，在安卓平臺(tái)仍然適用，不外乎乘法除法計(jì)算的優(yōu)化

發(fā)表于 02-01 16:25 ?862次閱讀

編譯器的優(yōu)化選項(xiàng)

這一點(diǎn)，需要了解編譯器的能力和限制；第三，要了解硬件的運(yùn)行方式，針對硬件特性進(jìn)行優(yōu)化。本文著重展開第二點(diǎn)和第三點(diǎn)。簡單認(rèn)識(shí)編譯器 要寫出高性能的代

發(fā)表于 11-24 15:37 ?838次閱讀

Keil編譯器優(yōu)化方法

我們都知道，代碼是可以通過編譯器優(yōu)化的，有的時(shí)候，為了提高運(yùn)行速度或者減少代碼尺寸，會(huì)開啟優(yōu)化選項(xiàng)。

發(fā)表于 10-23 16:35 ?257次閱讀