忍者ブログ

なんだか

知らないほうが幸せかもしれない

[PR]

×

[PR]上記の広告は3ヶ月以上新規記事投稿のないブログに表示されています。新しい記事を書く事で広告が消えます。

rx-elf-gccで分岐の最適化を眺めてみる

rx-elf-gccでvolatileつけた変数の参照、変更した時のコードを覗いてみました。
試したソースはこれです。

volatile
unsigned
char bar1;

volatile
unsigned
char bar;

void
tst_bar_bit0(void)
{
  if(bar1&1)
    bar &= ~1;
  else
    bar |= 1;
}

rx-elf-gccで-O2 -fomitframe-pointerでコンパイルすると

                         _tst_bar_bit0:
0000 FB E2 00 00 00 00        mov.L #_bar1, r14
0006 CC EE                    mov.B [r14], r14
0008 FD 74 CE 01              tst #1, r14
000c FB E2 00 00 00 00        mov.L #_bar, r14
0012 CC E4                    mov.B [r14], r4
0014 1E                       bne .L5
0015 65 14                    or #1, r4
0017 C3 E4                    mov.B r4, [r14]
0019 02                       rts
                         .L5:
001a 75 24 FE                 and #-2, r4
001d C3 E4                    mov.B r4, [r14]
001f 02                       rts

こうなります。
volatileつけた変数を参照、変更してるから、最適化は無効になってるのかと思いきや、最適化されてます。

で、巷でよく聞くメモリバリアというのをソースに埋め込んでみました。

void
tst_bar_bit0(void)
{
   if(bar1&1)
     {
       __asm volatile (";memory1":::"memory");
       bar &= ~1;
     }
     else
     {
       __asm volatile (";memory2":::"memory");
       bar |= 1;
     }
}


                         _tst_bar_bit0:
0000 FB E2 00 00 00 00        mov.L #_bar1, r14
0006 CC EE                    mov.B [r14], r14
0008 FD 74 CE 01              tst #1, r14
000c 1A                       bne .L5
                         ; 32 "tst1b.c" 1
                         ;memory2
                         ; 0 "" 2
000d FB E2 00 00 00 00        mov.L #_bar, r14
0013 F0 E0                    bset #0, [r14].B
0015 02                       rts
                         .L5:
                         ; 27 "tst1b.c" 1
                         ;memory1
                         ; 0 "" 2
0016 FB E2 00 00 00 00        mov.L #_bar, r14
001c F0 E8                    bclr #0, [r14].B
001e 02                       rts

今度は期待した通りのコードになっています。
分岐を最適化するオプション-fcrossjumpingというのがあるので
それを無効にするように-fno-crossjumpingで元々のソースをコンパイルすると

0000 FB E2 00 00 00 00        mov.L   #_bar1, r14
0006 CC EE                    mov.B   [r14], r14
0008 FD 74 CE 01              tst     #1, r14
000c 1A                       bne     .L5
000d FB E2 00 00 00 00        mov.L   #_bar, r14
0013 F0 E0                    bset    #0, [r14].B
0015 02                       rts
                       .L5:
0016 FB E2 00 00 00 00        mov.L   #_bar, r14
001c F0 E8                    bclr    #0, [r14].B
001e 02                       rts

こうなりました。
(素のgccのソースでビルドしたgccではbset,bclrのコードは出ませんので)

volatile付けると最適化抑止になると思いきや、こういうことがあるんですね。

archによっては、-fcrossjumpingが無効になってるものもあるようです。

ちなみに、mips-elf-gccだとこうなりました。

0000 93820000         lbu    $2,%gp_rel(bar1)($28)
0004 00000000         nop
0008 30420001         andi   $2,$2,0x1
000c 14400008         bne    $2,$0,$L5
0010 00000000         nop
0014 93820000         lbu    $2,%gp_rel(bar)($28)
0018 00000000         nop
001c 304200FF         andi   $2,$2,0x00ff
0020 34420001         ori    $2,$2,0x1
0024 A3820000         sb     $2,%gp_rel(bar)($28)
0028 03E00008         j      $31
002c 00000000         nop
                 $L5:
0030 93820000         lbu    $2,%gp_rel(bar)($28)
0034 00000000         nop
0038 304200FE         andi   $2,$2,0xfe
003c A3820000         sb     $2,%gp_rel(bar)($28)
0040 03E00008         j      $31
0044 00000000         nop


拍手[0回]

PR

コメント

お名前
タイトル
文字色
メールアドレス
URL
コメント
パスワード Vodafone絵文字 i-mode絵文字 Ezweb絵文字

カレンダー

03 2024/04 05
S M T W T F S
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30

フリーエリア

最新CM

最新記事

(07/27)
(03/27)
(03/26)
(03/23)
(03/22)
(03/19)
(03/18)
(03/18)
(03/15)
(03/14)
(03/13)
(03/12)
(03/11)
(03/11)
(03/08)
(03/08)
(03/06)
(03/05)
(03/02)
(03/01)
(02/28)
(02/27)
(02/24)
(02/23)
(02/22)

プロフィール

HN:
kenrou
性別:
非公開

バーコード

ブログ内検索

最古記事

(12/15)
(12/16)
(12/17)
(12/18)
(12/19)
(12/20)
(12/21)
(12/22)
(12/23)
(12/24)
(12/25)
(12/26)
(12/27)
(12/28)
(12/29)
(12/30)
(12/31)
(01/01)
(01/02)
(01/21)
(01/22)
(01/23)
(01/24)
(01/24)
(01/28)

P R

忍者アナライズ

コガネモチ

忍者カウンター

カレンダー

03 2024/04 05
S M T W T F S
1 2 3 4 5 6
7 8 9 10 11 12 13
14 15 16 17 18 19 20
21 22 23 24 25 26 27
28 29 30