Compiler Construction Lecture 1/20

先週の復習

先週は、以下のことを勉強した。

左辺値と右辺値 (left value and right value)
Micro-C の中間木
indirect and reference
array and struct
ポインタに関するコード生成

先週の問題の解答

以下のCのstatementに対応するMicro-Cの中間木と生成される6809のコードについて考察せよ。ただし、以下のint *a; という型を仮定する。

*a = 1;
a = &a[3];
*a = *(a + a[3] + 2);
a = *( &a + 3);

答え

もちろん、生成されるコードはコンパイルすれば簡単にわかってしまう。これができなかった人は、さぼっているだけだろう。また、中間木に関しても、それを印刷するコンパイラを作成したので答を得るだけならば誰にでもできる。実際、/usr/open/lectures/kono/compiler/mc/mc1 を使うと、(source を list 中に含める -s option を使って) 以下のように c.out が出力される。

* int *a;
a	EQU	0
* main()
* {
* 
* *a = 1;
main
	PSHS	U
	LEAU	,S
* generate code on type:
* list(INT)
* expr:
*  list(ASS,
*  list(INDIRECT,
*   list(RGVAR,0)),
*  list(CONST,1))
	LDD	#1
	STD	[0,Y]
* a = &a[3];
* generate code on type:
*  list(POINTER,
* list(INT))
* expr:
*  list(ASS,
*  list(GVAR,0),
*  list(ADD,
*   list(RGVAR,0),
*   list(CONST,6)))
	LDD	0,Y
	ADDD	#6
	STD	0,Y
* *a = *(a + a[3] + 2);
* generate code on type:
* list(INT)
* expr:
*  list(ASS,
*  list(INDIRECT,
*   list(RGVAR,0)),
*  list(RINDIRECT,
*   list(ADD,
*    list(ADD,
*     list(MUL,
*      list(RINDIRECT,
*       list(ADD,
*        list(RGVAR,0),
*        list(CONST,6))),
*      list(CONST,2)),
*     list(RGVAR,0)),
*    list(CONST,4))))
	LDX	0,Y
	LDD	6,X
	ASLB
	ROLA
	ADDD	0,Y
	PSHS	D
	LDD	#4
	PULS	X
	LDD	D,X
	STD	[0,Y]
* a = *( &a  + 3);
* generate code on type:
*  list(POINTER,
* list(INT))
* expr:
*  list(ASS,
*  list(GVAR,0),
*  list(RGVAR,6))
	LDD	6,Y
	STD	0,Y

どうして、このようなコード出力になるのかは木構造が分かってしまえば、 gexpr() をトレースするだけの問題である。この木構造は、最後の例では単純な構文木とは少々異なる。それは、indirect()や、rvalue() などが構文木を変換しているからである。

問題2

&a = (int *)3; というのは、Micro-C ではエラーになる。なぜ、エラーなのかを説明せよ。

答え

実際にコンパイラを走らせてみれば、

    9:Lvalue required.
&a = (int *)3; 
     ^

というエラー出力される。このエラーメッセージを確認しないで答えを出そうと言うのは、少し虫が良すぎる。コードの(int *)3の部分にはエラーはない。実際、

* a = (int *)3; 
* generate code on type:
*  list(POINTER,
* list(INT))
* expr:
*  list(ASS,
*  list(GVAR,0),
*  list(CONST,3))
        LDD     #3
        STD     0,Y

という形にコンパイルされる。問題は明らかに&aの部分にある。しかし、前の授業でも説明したように、構文的なエラーはない。このエラーは代入文 (assignemnt)に特有なエラーである。実際、Lvalue required というエラーは、

   257			(n==LVERR) ? "Lvalue required" :

であり、LVERR は、expr13の&の部分と、

  1363	lcheck(e)
  1364	int e;
  1365	{	if(!scalar(type)||car(e)!=GVAR&&car(e)!=LVAR&&car(e)!=INDIRECT)
  1366			error(LVERR);
  1367	}

に出てくる。expr13()ではなくlcheck()でエラーになっているのはトレースしてみればすぐにわかる。この場合は、

   994  expr1()
   995  {int e1,e2,t,op;
   996          e1=expr2();
   997          switch (sym)
   998          {case ASS:
   999                  lcheck(e1);
  1000                  t=type;

ここのlcheck()でエラーになるわけである。実際、lcheck では、左辺値は、整数(scalar)か、大域変数(GVAR)か、局所変数(LVAR)か、間接参照であるとしている。&a は、そのどれでもないのでエラーとなる。(ANSI-C では、この他にも、いくつか左辺値を許している。どのようなものがあるだろうか?)

手続き呼び出しと、変数の配置

これで、左辺値、右辺値ののコード生成、条件分岐やループのコード生成を勉強したことになる。コード生成の流れを少しまとめてみたので参考にしてみてほしい。 Micor-C のコード生成

あとコンパイラで問題になるのは、手続き呼び出しである。これは局所変数 (local variable)の配置とも密接に結び付いている。手続きは、引数を持つのが普通であり、これが呼び出し側(caller)と呼び出された側(callee) を結び付ける。

Cは手続きは値渡しと呼ばれ、単に値をコピーして送るだけで良い。Pascal などは参照渡しと呼ばれ、アドレスを送る必要がある。参照渡しならば、引数をcallee側で変更することができるので、複数の値を返したい時になどには便利だ。しかし、Cでもアドレスを直接送れば同じことができる。この方が実装的には美しい。が、C++ では参照渡しを復活させてしまったようだ... 参照渡しには複雑な問題が付きまとい、理論的にもかなりうっとうしい。しかし、プログラムの記述は簡潔になる。見掛けを取るか、使いやすさを取るか、そういう問題かも知れない。

局所変数や引数は、手続きが終ればなくなる変数である。これらはスタック上にとられる。スタックは、通常、CPUに特別なサポートがあり、特別な registerを使うことになっている。これでは不便なことも多いので、それを Frame Pointer というのにコピーして使うことが多い。Frame Pointerは、単なるindex registerを使うのが普通だが、どのregisterかは固定されているのが普通である。

6809の場合は、S がsystem stackで、Uがuser stackであり、UがFrame Pointer として使われている。例えば、

* main()
* {
* int i,j;
* int (*func)();
* 
* i = a[1];
main
        PSHS    U
        LEAU    ,S
        LEAS    -6,S
        LDD     8,Y
        STD     -2,U
* func  = (int (*)())i;
        LDD     -2,U
        STD     -6,U
* return (*func)(j);
        LDD     -4,U
        PSHS    D
        LDX     -6,U
        JSR     ,X
        LEAS    2,S
* }
        LEAS    ,U
        PULS    U,PC
_3      RTS
_INITIALIZE     EQU     _1
_GLOBALS        EQU     12
        END

というような感じになる。

Micro-C では、手続き名の型はFNAMEであり、式を表す中間木の型はFUNCTION である。実際のコード生成はfunction()で行われる。(問題3: では、手続きの構文解析はどこで行われているか?)

引数はスタックにつまれ、callee側ではUに対する負のオフセットを使ってアクセスすることになる。この引数はcallerに戻る時にはなくなってしまっているので、扱うことはできない。

SPARCでは、変わった呼び出し方をしている。SPARCには overraped register window というのがあり、それぞれ、%i,%l,%o というように区別されている。それぞれ8本ずつある。call すると、caller の %o が、callee の%i となる。これを引数渡しに使う。(したがって8個以上の引数はregister渡しにできない。実際にはframe pointerやstack pointerがあるので、もっと少ない) また、浮動小数点には、regisger windowはない。 calleeからcallerに戻る時には、再び%iが%oとなる。これによって値を返すことができる。この切替えは、save/restore という命令によっておこなわれる。

この方法の良いところは、stackにいちいち値をcopyしなくても済むところである。しかし、register windowは無限にあるわけではないので、いつかはいっぱいになってしまう。その時にはsub routineを呼び出して、register windowの中身をスタックにcopyする。copyした後、戻る時には、また、スタックからregister windowにcopyする。実際のアプリケーションでは、この register window overflowが頻繁に起きるので、残念ながら、この方法が成功しているとはいえなかったようである。

実際には以下のような呼び出しを用いる。

        mov 4,%g3
        call _print,0
        mov %g3,%o0        callより、こちらが先に実行される
L1:
        ret
        restore            register window をもとにもどす
        .align 8
        .global _print
        .proc   04
_print:
        !#PROLOGUE# 0
        save %sp,-104,%sp        register window の切替え
        !#PROLOGUE# 1
        st %i0,[%fp+68]          %i0にcallerの%o0が入っている
        sethi %hi(LC0),%o1
        or %o1,%lo(LC0),%o0
        ld [%fp+68],%o1
        ld [%fp+68],%o2
        call _printf,0           この呼び出しはregister windowを使わない
        nop
L2:
        ret     
        restore                  ret より先にこちらが実行される

基本ブロックとフローグラフ

これまでは、式(expression)単位のコンパイルを考えてきた。このコンパイルは、直接的で簡単である。レジスタの数の少ない6809では最適に近いコードを出力ることができる。しかし、最適化(optimize)を考える時、特にレジスタの数の多いRISCの場合は、これではレジスタを有効利用しているとはいえない。

式の単位での最適化と、式を越えた大域的な最適化を考えるために、基本ブロック(Basic Block)とフローグラフ(Flow Graph)というものが工夫された。

基本単位は、単純に言えば、条件分岐や分岐を含まない逐次計算の部分である。フローグラフは、一つの手続の中で基本ブロックを分岐を結んだものである。

mc.c の reverse() はリストを逆順にするものだが、

   484	reverse(t1)
   485	int t1;
   486	{int t2,t3;
   487		t2=t1;
   488		while(type!=t1)
   489		{	t3=cadr(type);
   490			rplacad(type,t2);
   491			t2=type;
   492			type=t3;
   493		}
   494		type=t2;
   495	}

このcadr()とかrplcad()は

  2840	cadr(e)
  2841	int e;
  2842	{	return heap[e+1];
  2843	}
  2894	rplacad(e,n)
  2895	int e,n;
  2896	{	heap[e+1]=n;
  2897		return e;
  2898	}

である。すると、

   484	reverse(t1)
   485	int t1;
   486	{int t2,t3;
   487		t2=t1;
   488		while(type!=t1)
   489		{	t3=heap[type+1];
   490			heap[type+1]=t2;
   491			t2=type;
   492			type=t3;
   493		}
   494		type=t2;
   495	}

としてよい。

問題1

このフローグラフを考えてみよう。

prev
next