]> git.xonotic.org Git - xonotic/gmqcc.git/blob - ir.c
Merge branch 'master' into blub/bc3
[xonotic/gmqcc.git] / ir.c
1 /*
2  * Copyright (C) 2012
3  *     Wolfgang Bumiller
4  *
5  * Permission is hereby granted, free of charge, to any person obtaining a copy of
6  * this software and associated documentation files (the "Software"), to deal in
7  * the Software without restriction, including without limitation the rights to
8  * use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies
9  * of the Software, and to permit persons to whom the Software is furnished to do
10  * so, subject to the following conditions:
11  *
12  * The above copyright notice and this permission notice shall be included in all
13  * copies or substantial portions of the Software.
14  *
15  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
16  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
17  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
18  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
19  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
20  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
21  * SOFTWARE.
22  */
23 #include <stdlib.h>
24 #include <string.h>
25 #include "gmqcc.h"
26 #include "ir.h"
27
28 /***********************************************************************
29  * Type sizes used at multiple points in the IR codegen
30  */
31
32 const char *type_name[TYPE_COUNT] = {
33     "void",
34     "string",
35     "float",
36     "vector",
37     "entity",
38     "field",
39     "function",
40     "pointer",
41 #if 0
42     "integer",
43 #endif
44     "quaternion",
45     "matrix",
46     "variant"
47 };
48
49 size_t type_sizeof[TYPE_COUNT] = {
50     1, /* TYPE_VOID     */
51     1, /* TYPE_STRING   */
52     1, /* TYPE_FLOAT    */
53     3, /* TYPE_VECTOR   */
54     1, /* TYPE_ENTITY   */
55     1, /* TYPE_FIELD    */
56     1, /* TYPE_FUNCTION */
57     1, /* TYPE_POINTER  */
58 #if 0
59     1, /* TYPE_INTEGER  */
60 #endif
61     4, /* TYPE_QUATERNION */
62     16, /* TYPE_MATRIX */
63     16, /* TYPE_VARIANT  */
64 };
65
66 uint16_t type_store_instr[TYPE_COUNT] = {
67     INSTR_STORE_F, /* should use I when having integer support */
68     INSTR_STORE_S,
69     INSTR_STORE_F,
70     INSTR_STORE_V,
71     INSTR_STORE_ENT,
72     INSTR_STORE_FLD,
73     INSTR_STORE_FNC,
74     INSTR_STORE_ENT, /* should use I */
75 #if 0
76     INSTR_STORE_I, /* integer type */
77 #endif
78     INSTR_STORE_Q,
79     INSTR_STORE_M,
80
81     INSTR_STORE_M, /* variant, should never be accessed */
82 };
83
84 uint16_t type_storep_instr[TYPE_COUNT] = {
85     INSTR_STOREP_F, /* should use I when having integer support */
86     INSTR_STOREP_S,
87     INSTR_STOREP_F,
88     INSTR_STOREP_V,
89     INSTR_STOREP_ENT,
90     INSTR_STOREP_FLD,
91     INSTR_STOREP_FNC,
92     INSTR_STOREP_ENT, /* should use I */
93 #if 0
94     INSTR_STOREP_ENT, /* integer type */
95 #endif
96     INSTR_STOREP_Q,
97     INSTR_STOREP_M,
98
99     INSTR_STOREP_M, /* variant, should never be accessed */
100 };
101
102 MEM_VEC_FUNCTIONS(ir_value_vector, ir_value*, v)
103
104 /***********************************************************************
105  *IR Builder
106  */
107
108 ir_builder* ir_builder_new(const char *modulename)
109 {
110     ir_builder* self;
111
112     self = (ir_builder*)mem_a(sizeof(*self));
113     if (!self)
114         return NULL;
115
116     MEM_VECTOR_INIT(self, functions);
117     MEM_VECTOR_INIT(self, globals);
118     self->name = NULL;
119     if (!ir_builder_set_name(self, modulename)) {
120         mem_d(self);
121         return NULL;
122     }
123
124     /* globals which always exist */
125
126     /* for now we give it a vector size */
127     ir_builder_create_global(self, "OFS_RETURN", TYPE_VARIANT);
128
129     return self;
130 }
131
132 MEM_VEC_FUNCTIONS(ir_builder, ir_value*, globals)
133 MEM_VEC_FUNCTIONS(ir_builder, ir_function*, functions)
134
135 void ir_builder_delete(ir_builder* self)
136 {
137     size_t i;
138     mem_d((void*)self->name);
139     for (i = 0; i != self->functions_count; ++i) {
140         ir_function_delete(self->functions[i]);
141     }
142     MEM_VECTOR_CLEAR(self, functions);
143     for (i = 0; i != self->globals_count; ++i) {
144         ir_value_delete(self->globals[i]);
145     }
146     MEM_VECTOR_CLEAR(self, globals);
147     mem_d(self);
148 }
149
150 bool ir_builder_set_name(ir_builder *self, const char *name)
151 {
152     if (self->name)
153         mem_d((void*)self->name);
154     self->name = util_strdup(name);
155     return !!self->name;
156 }
157
158 ir_function* ir_builder_get_function(ir_builder *self, const char *name)
159 {
160     size_t i;
161     for (i = 0; i < self->functions_count; ++i) {
162         if (!strcmp(name, self->functions[i]->name))
163             return self->functions[i];
164     }
165     return NULL;
166 }
167
168 ir_function* ir_builder_create_function(ir_builder *self, const char *name, int outtype)
169 {
170     ir_function *fn = ir_builder_get_function(self, name);
171     if (fn) {
172         return NULL;
173     }
174
175     fn = ir_function_new(self, outtype);
176     if (!ir_function_set_name(fn, name) ||
177         !ir_builder_functions_add(self, fn) )
178     {
179         ir_function_delete(fn);
180         return NULL;
181     }
182
183     fn->value = ir_builder_create_global(self, fn->name, TYPE_FUNCTION);
184     if (!fn->value) {
185         ir_function_delete(fn);
186         return NULL;
187     }
188
189     fn->value->isconst = true;
190     fn->value->outtype = outtype;
191     fn->value->constval.vfunc = fn;
192     fn->value->context = fn->context;
193
194     return fn;
195 }
196
197 ir_value* ir_builder_get_global(ir_builder *self, const char *name)
198 {
199     size_t i;
200     for (i = 0; i < self->globals_count; ++i) {
201         if (!strcmp(self->globals[i]->name, name))
202             return self->globals[i];
203     }
204     return NULL;
205 }
206
207 ir_value* ir_builder_create_global(ir_builder *self, const char *name, int vtype)
208 {
209     ir_value *ve;
210
211     if (name && name[0] != '#')
212     {
213         ve = ir_builder_get_global(self, name);
214         if (ve) {
215             return NULL;
216         }
217     }
218
219     ve = ir_value_var(name, store_global, vtype);
220     if (!ir_builder_globals_add(self, ve)) {
221         ir_value_delete(ve);
222         return NULL;
223     }
224     return ve;
225 }
226
227 /***********************************************************************
228  *IR Function
229  */
230
231 bool ir_function_naive_phi(ir_function*);
232 void ir_function_enumerate(ir_function*);
233 bool ir_function_calculate_liferanges(ir_function*);
234 bool ir_function_allocate_locals(ir_function*);
235
236 ir_function* ir_function_new(ir_builder* owner, int outtype)
237 {
238     ir_function *self;
239     self = (ir_function*)mem_a(sizeof(*self));
240
241     if (!self)
242         return NULL;
243
244     self->name = NULL;
245     if (!ir_function_set_name(self, "<@unnamed>")) {
246         mem_d(self);
247         return NULL;
248     }
249     self->owner = owner;
250     self->context.file = "<@no context>";
251     self->context.line = 0;
252     self->outtype = outtype;
253     self->value = NULL;
254     self->builtin = 0;
255     MEM_VECTOR_INIT(self, params);
256     MEM_VECTOR_INIT(self, blocks);
257     MEM_VECTOR_INIT(self, values);
258     MEM_VECTOR_INIT(self, locals);
259
260     self->run_id = 0;
261     return self;
262 }
263 MEM_VEC_FUNCTIONS(ir_function, ir_value*, values)
264 MEM_VEC_FUNCTIONS(ir_function, ir_block*, blocks)
265 MEM_VEC_FUNCTIONS(ir_function, ir_value*, locals)
266 MEM_VEC_FUNCTIONS(ir_function, int,       params)
267
268 bool ir_function_set_name(ir_function *self, const char *name)
269 {
270     if (self->name)
271         mem_d((void*)self->name);
272     self->name = util_strdup(name);
273     return !!self->name;
274 }
275
276 void ir_function_delete(ir_function *self)
277 {
278     size_t i;
279     mem_d((void*)self->name);
280
281     for (i = 0; i != self->blocks_count; ++i)
282         ir_block_delete(self->blocks[i]);
283     MEM_VECTOR_CLEAR(self, blocks);
284
285     MEM_VECTOR_CLEAR(self, params);
286
287     for (i = 0; i != self->values_count; ++i)
288         ir_value_delete(self->values[i]);
289     MEM_VECTOR_CLEAR(self, values);
290
291     for (i = 0; i != self->locals_count; ++i)
292         ir_value_delete(self->locals[i]);
293     MEM_VECTOR_CLEAR(self, locals);
294
295     /* self->value is deleted by the builder */
296
297     mem_d(self);
298 }
299
300 bool GMQCC_WARN ir_function_collect_value(ir_function *self, ir_value *v)
301 {
302     return ir_function_values_add(self, v);
303 }
304
305 ir_block* ir_function_create_block(ir_function *self, const char *label)
306 {
307     ir_block* bn = ir_block_new(self, label);
308     memcpy(&bn->context, &self->context, sizeof(self->context));
309     if (!ir_function_blocks_add(self, bn)) {
310         ir_block_delete(bn);
311         return NULL;
312     }
313     return bn;
314 }
315
316 bool ir_function_finalize(ir_function *self)
317 {
318     if (self->builtin)
319         return true;
320
321     if (!ir_function_naive_phi(self))
322         return false;
323
324     ir_function_enumerate(self);
325
326     if (!ir_function_calculate_liferanges(self))
327         return false;
328
329     if (!ir_function_allocate_locals(self))
330         return false;
331     return true;
332 }
333
334 ir_value* ir_function_get_local(ir_function *self, const char *name)
335 {
336     size_t i;
337     for (i = 0; i < self->locals_count; ++i) {
338         if (!strcmp(self->locals[i]->name, name))
339             return self->locals[i];
340     }
341     return NULL;
342 }
343
344 ir_value* ir_function_create_local(ir_function *self, const char *name, int vtype, bool param)
345 {
346     ir_value *ve = ir_function_get_local(self, name);
347     if (ve) {
348         return NULL;
349     }
350
351     if (param &&
352         self->locals_count &&
353         self->locals[self->locals_count-1]->store != store_param) {
354         printf("cannot add parameters after adding locals\n");
355         return NULL;
356     }
357
358     ve = ir_value_var(name, (param ? store_param : store_local), vtype);
359     if (!ir_function_locals_add(self, ve)) {
360         ir_value_delete(ve);
361         return NULL;
362     }
363     return ve;
364 }
365
366 /***********************************************************************
367  *IR Block
368  */
369
370 ir_block* ir_block_new(ir_function* owner, const char *name)
371 {
372     ir_block *self;
373     self = (ir_block*)mem_a(sizeof(*self));
374     if (!self)
375         return NULL;
376
377     memset(self, 0, sizeof(*self));
378
379     self->label = NULL;
380     if (!ir_block_set_label(self, name)) {
381         mem_d(self);
382         return NULL;
383     }
384     self->owner = owner;
385     self->context.file = "<@no context>";
386     self->context.line = 0;
387     self->final = false;
388     MEM_VECTOR_INIT(self, instr);
389     MEM_VECTOR_INIT(self, entries);
390     MEM_VECTOR_INIT(self, exits);
391
392     self->eid = 0;
393     self->is_return = false;
394     self->run_id = 0;
395     MEM_VECTOR_INIT(self, living);
396
397     self->generated = false;
398
399     return self;
400 }
401 MEM_VEC_FUNCTIONS(ir_block, ir_instr*, instr)
402 MEM_VEC_FUNCTIONS_ALL(ir_block, ir_block*, entries)
403 MEM_VEC_FUNCTIONS_ALL(ir_block, ir_block*, exits)
404 MEM_VEC_FUNCTIONS_ALL(ir_block, ir_value*, living)
405
406 void ir_block_delete(ir_block* self)
407 {
408     size_t i;
409     mem_d(self->label);
410     for (i = 0; i != self->instr_count; ++i)
411         ir_instr_delete(self->instr[i]);
412     MEM_VECTOR_CLEAR(self, instr);
413     MEM_VECTOR_CLEAR(self, entries);
414     MEM_VECTOR_CLEAR(self, exits);
415     MEM_VECTOR_CLEAR(self, living);
416     mem_d(self);
417 }
418
419 bool ir_block_set_label(ir_block *self, const char *name)
420 {
421     if (self->label)
422         mem_d((void*)self->label);
423     self->label = util_strdup(name);
424     return !!self->label;
425 }
426
427 /***********************************************************************
428  *IR Instructions
429  */
430
431 ir_instr* ir_instr_new(ir_block* owner, int op)
432 {
433     ir_instr *self;
434     self = (ir_instr*)mem_a(sizeof(*self));
435     if (!self)
436         return NULL;
437
438     self->owner = owner;
439     self->context.file = "<@no context>";
440     self->context.line = 0;
441     self->opcode = op;
442     self->_ops[0] = NULL;
443     self->_ops[1] = NULL;
444     self->_ops[2] = NULL;
445     self->bops[0] = NULL;
446     self->bops[1] = NULL;
447     MEM_VECTOR_INIT(self, phi);
448     MEM_VECTOR_INIT(self, params);
449
450     self->eid = 0;
451     return self;
452 }
453 MEM_VEC_FUNCTIONS(ir_instr, ir_phi_entry_t, phi)
454 MEM_VEC_FUNCTIONS(ir_instr, ir_value*, params)
455
456 void ir_instr_delete(ir_instr *self)
457 {
458     size_t i;
459     /* The following calls can only delete from
460      * vectors, we still want to delete this instruction
461      * so ignore the return value. Since with the warn_unused_result attribute
462      * gcc doesn't care about an explicit: (void)foo(); to ignore the result,
463      * I have to improvise here and use if(foo());
464      */
465     for (i = 0; i < self->phi_count; ++i) {
466         size_t idx;
467         if (ir_value_writes_find(self->phi[i].value, self, &idx))
468             if (ir_value_writes_remove(self->phi[i].value, idx)) GMQCC_SUPPRESS_EMPTY_BODY;
469         if (ir_value_reads_find(self->phi[i].value, self, &idx))
470             if (ir_value_reads_remove (self->phi[i].value, idx)) GMQCC_SUPPRESS_EMPTY_BODY;
471     }
472     MEM_VECTOR_CLEAR(self, phi);
473     for (i = 0; i < self->params_count; ++i) {
474         size_t idx;
475         if (ir_value_writes_find(self->params[i], self, &idx))
476             if (ir_value_writes_remove(self->params[i], idx)) GMQCC_SUPPRESS_EMPTY_BODY;
477         if (ir_value_reads_find(self->params[i], self, &idx))
478             if (ir_value_reads_remove (self->params[i], idx)) GMQCC_SUPPRESS_EMPTY_BODY;
479     }
480     MEM_VECTOR_CLEAR(self, params);
481     if (ir_instr_op(self, 0, NULL, false)) GMQCC_SUPPRESS_EMPTY_BODY;
482     if (ir_instr_op(self, 1, NULL, false)) GMQCC_SUPPRESS_EMPTY_BODY;
483     if (ir_instr_op(self, 2, NULL, false)) GMQCC_SUPPRESS_EMPTY_BODY;
484     mem_d(self);
485 }
486
487 bool ir_instr_op(ir_instr *self, int op, ir_value *v, bool writing)
488 {
489     if (self->_ops[op]) {
490         size_t idx;
491         if (writing && ir_value_writes_find(self->_ops[op], self, &idx))
492         {
493             if (!ir_value_writes_remove(self->_ops[op], idx))
494                 return false;
495         }
496         else if (ir_value_reads_find(self->_ops[op], self, &idx))
497         {
498             if (!ir_value_reads_remove(self->_ops[op], idx))
499                 return false;
500         }
501     }
502     if (v) {
503         if (writing) {
504             if (!ir_value_writes_add(v, self))
505                 return false;
506         } else {
507             if (!ir_value_reads_add(v, self))
508                 return false;
509         }
510     }
511     self->_ops[op] = v;
512     return true;
513 }
514
515 /***********************************************************************
516  *IR Value
517  */
518
519 ir_value* ir_value_var(const char *name, int storetype, int vtype)
520 {
521     ir_value *self;
522     self = (ir_value*)mem_a(sizeof(*self));
523     self->vtype = vtype;
524     self->fieldtype = TYPE_VOID;
525     self->outtype = TYPE_VOID;
526     self->store = storetype;
527     MEM_VECTOR_INIT(self, reads);
528     MEM_VECTOR_INIT(self, writes);
529     self->isconst = false;
530     self->context.file = "<@no context>";
531     self->context.line = 0;
532     self->name = NULL;
533     ir_value_set_name(self, name);
534
535     memset(&self->constval, 0, sizeof(self->constval));
536     memset(&self->code,     0, sizeof(self->code));
537
538     MEM_VECTOR_INIT(self, life);
539     return self;
540 }
541 MEM_VEC_FUNCTIONS(ir_value, ir_life_entry_t, life)
542 MEM_VEC_FUNCTIONS_ALL(ir_value, ir_instr*, reads)
543 MEM_VEC_FUNCTIONS_ALL(ir_value, ir_instr*, writes)
544
545 ir_value* ir_value_out(ir_function *owner, const char *name, int storetype, int vtype)
546 {
547     ir_value *v = ir_value_var(name, storetype, vtype);
548     if (!v)
549         return NULL;
550     if (!ir_function_collect_value(owner, v))
551     {
552         ir_value_delete(v);
553         return NULL;
554     }
555     return v;
556 }
557
558 void ir_value_delete(ir_value* self)
559 {
560     if (self->name)
561         mem_d((void*)self->name);
562     if (self->isconst)
563     {
564         if (self->vtype == TYPE_STRING)
565             mem_d((void*)self->constval.vstring);
566     }
567     MEM_VECTOR_CLEAR(self, reads);
568     MEM_VECTOR_CLEAR(self, writes);
569     MEM_VECTOR_CLEAR(self, life);
570     mem_d(self);
571 }
572
573 void ir_value_set_name(ir_value *self, const char *name)
574 {
575     if (self->name)
576         mem_d((void*)self->name);
577     self->name = util_strdup(name);
578 }
579
580 bool ir_value_set_float(ir_value *self, float f)
581 {
582     if (self->vtype != TYPE_FLOAT)
583         return false;
584     self->constval.vfloat = f;
585     self->isconst = true;
586     return true;
587 }
588
589 bool ir_value_set_func(ir_value *self, int f)
590 {
591     if (self->vtype != TYPE_FUNCTION)
592         return false;
593     self->constval.vint = f;
594     self->isconst = true;
595     return true;
596 }
597
598 bool ir_value_set_vector(ir_value *self, vector v)
599 {
600     if (self->vtype != TYPE_VECTOR)
601         return false;
602     self->constval.vvec = v;
603     self->isconst = true;
604     return true;
605 }
606
607 bool ir_value_set_quaternion(ir_value *self, quaternion v)
608 {
609     if (self->vtype != TYPE_QUATERNION)
610         return false;
611     memcpy(&self->constval.vquat, v, sizeof(self->constval.vquat));
612     self->isconst = true;
613     return true;
614 }
615
616 bool ir_value_set_matrix(ir_value *self, matrix v)
617 {
618     if (self->vtype != TYPE_MATRIX)
619         return false;
620     memcpy(&self->constval.vmat, v, sizeof(self->constval.vmat));
621     self->isconst = true;
622     return true;
623 }
624
625 bool ir_value_set_string(ir_value *self, const char *str)
626 {
627     if (self->vtype != TYPE_STRING)
628         return false;
629     self->constval.vstring = util_strdup(str);
630     self->isconst = true;
631     return true;
632 }
633
634 #if 0
635 bool ir_value_set_int(ir_value *self, int i)
636 {
637     if (self->vtype != TYPE_INTEGER)
638         return false;
639     self->constval.vint = i;
640     self->isconst = true;
641     return true;
642 }
643 #endif
644
645 bool ir_value_lives(ir_value *self, size_t at)
646 {
647     size_t i;
648     for (i = 0; i < self->life_count; ++i)
649     {
650         ir_life_entry_t *life = &self->life[i];
651         if (life->start <= at && at <= life->end)
652             return true;
653         if (life->start > at) /* since it's ordered */
654             return false;
655     }
656     return false;
657 }
658
659 bool ir_value_life_insert(ir_value *self, size_t idx, ir_life_entry_t e)
660 {
661     size_t k;
662     if (!ir_value_life_add(self, e)) /* naive... */
663         return false;
664     for (k = self->life_count-1; k > idx; --k)
665         self->life[k] = self->life[k-1];
666     self->life[idx] = e;
667     return true;
668 }
669
670 bool ir_value_life_merge(ir_value *self, size_t s)
671 {
672     size_t i;
673     ir_life_entry_t *life = NULL;
674     ir_life_entry_t *before = NULL;
675     ir_life_entry_t new_entry;
676
677     /* Find the first range >= s */
678     for (i = 0; i < self->life_count; ++i)
679     {
680         before = life;
681         life = &self->life[i];
682         if (life->start > s)
683             break;
684     }
685     /* nothing found? append */
686     if (i == self->life_count) {
687         ir_life_entry_t e;
688         if (life && life->end+1 == s)
689         {
690             /* previous life range can be merged in */
691             life->end++;
692             return true;
693         }
694         if (life && life->end >= s)
695             return false;
696         e.start = e.end = s;
697         if (!ir_value_life_add(self, e))
698             return false; /* failing */
699         return true;
700     }
701     /* found */
702     if (before)
703     {
704         if (before->end + 1 == s &&
705             life->start - 1 == s)
706         {
707             /* merge */
708             before->end = life->end;
709             if (!ir_value_life_remove(self, i))
710                 return false; /* failing */
711             return true;
712         }
713         if (before->end + 1 == s)
714         {
715             /* extend before */
716             before->end++;
717             return true;
718         }
719         /* already contained */
720         if (before->end >= s)
721             return false;
722     }
723     /* extend */
724     if (life->start - 1 == s)
725     {
726         life->start--;
727         return true;
728     }
729     /* insert a new entry */
730     new_entry.start = new_entry.end = s;
731     return ir_value_life_insert(self, i, new_entry);
732 }
733
734 bool ir_value_life_merge_into(ir_value *self, const ir_value *other)
735 {
736     size_t i, myi;
737
738     if (!other->life_count)
739         return true;
740
741     if (!self->life_count) {
742         for (i = 0; i < other->life_count; ++i) {
743             if (!ir_value_life_add(self, other->life[i]))
744                 return false;
745         }
746         return true;
747     }
748
749     myi = 0;
750     for (i = 0; i < other->life_count; ++i)
751     {
752         const ir_life_entry_t *life = &other->life[i];
753         while (true)
754         {
755             ir_life_entry_t *entry = &self->life[myi];
756
757             if (life->end+1 < entry->start)
758             {
759                 /* adding an interval before entry */
760                 if (!ir_value_life_insert(self, myi, *life))
761                     return false;
762                 ++myi;
763                 break;
764             }
765
766             if (life->start <  entry->start &&
767                 life->end   >= entry->start)
768             {
769                 /* starts earlier and overlaps */
770                 entry->start = life->start;
771             }
772
773             if (life->end     >  entry->end &&
774                 life->start-1 <= entry->end)
775             {
776                 /* ends later and overlaps */
777                 entry->end = life->end;
778             }
779
780             /* see if our change combines it with the next ranges */
781             while (myi+1 < self->life_count &&
782                    entry->end+1 >= self->life[1+myi].start)
783             {
784                 /* overlaps with (myi+1) */
785                 if (entry->end < self->life[1+myi].end)
786                     entry->end = self->life[1+myi].end;
787                 if (!ir_value_life_remove(self, myi+1))
788                     return false;
789                 entry = &self->life[myi];
790             }
791
792             /* see if we're after the entry */
793             if (life->start > entry->end)
794             {
795                 ++myi;
796                 /* append if we're at the end */
797                 if (myi >= self->life_count) {
798                     if (!ir_value_life_add(self, *life))
799                         return false;
800                     break;
801                 }
802                 /* otherweise check the next range */
803                 continue;
804             }
805             break;
806         }
807     }
808     return true;
809 }
810
811 bool ir_values_overlap(const ir_value *a, const ir_value *b)
812 {
813     /* For any life entry in A see if it overlaps with
814      * any life entry in B.
815      * Note that the life entries are orderes, so we can make a
816      * more efficient algorithm there than naively translating the
817      * statement above.
818      */
819
820     ir_life_entry_t *la, *lb, *enda, *endb;
821
822     /* first of all, if either has no life range, they cannot clash */
823     if (!a->life_count || !b->life_count)
824         return false;
825
826     la = a->life;
827     lb = b->life;
828     enda = la + a->life_count;
829     endb = lb + b->life_count;
830     while (true)
831     {
832         /* check if the entries overlap, for that,
833          * both must start before the other one ends.
834          */
835 #if defined(LIFE_RANGE_WITHOUT_LAST_READ)
836         if (la->start <= lb->end &&
837             lb->start <= la->end)
838 #else
839         if (la->start <  lb->end &&
840             lb->start <  la->end)
841 #endif
842         {
843             return true;
844         }
845
846         /* entries are ordered
847          * one entry is earlier than the other
848          * that earlier entry will be moved forward
849          */
850         if (la->start < lb->start)
851         {
852             /* order: A B, move A forward
853              * check if we hit the end with A
854              */
855             if (++la == enda)
856                 break;
857         }
858         else if (lb->start < la->start)
859         {
860             /* order: B A, move B forward
861              * check if we hit the end with B
862              */
863             if (++lb == endb)
864                 break;
865         }
866     }
867     return false;
868 }
869
870 /***********************************************************************
871  *IR main operations
872  */
873
874 bool ir_block_create_store_op(ir_block *self, int op, ir_value *target, ir_value *what)
875 {
876     if (target->store == store_value) {
877         fprintf(stderr, "cannot store to an SSA value\n");
878         fprintf(stderr, "trying to store: %s <- %s\n", target->name, what->name);
879         return false;
880     } else {
881         ir_instr *in = ir_instr_new(self, op);
882         if (!in)
883             return false;
884         if (!ir_instr_op(in, 0, target, true) ||
885             !ir_instr_op(in, 1, what, false)  ||
886             !ir_block_instr_add(self, in) )
887         {
888             return false;
889         }
890         return true;
891     }
892 }
893
894 bool ir_block_create_store(ir_block *self, ir_value *target, ir_value *what)
895 {
896     int op = 0;
897     int vtype;
898     if (target->vtype == TYPE_VARIANT)
899         vtype = what->vtype;
900     else
901         vtype = target->vtype;
902
903 #if 0
904     if      (vtype == TYPE_FLOAT   && what->vtype == TYPE_INTEGER)
905         op = INSTR_CONV_ITOF;
906     else if (vtype == TYPE_INTEGER && what->vtype == TYPE_FLOAT)
907         op = INSTR_CONV_FTOI;
908 #endif
909         op = type_store_instr[vtype];
910
911     return ir_block_create_store_op(self, op, target, what);
912 }
913
914 bool ir_block_create_storep(ir_block *self, ir_value *target, ir_value *what)
915 {
916     int op = 0;
917     int vtype;
918
919     if (target->vtype != TYPE_POINTER)
920         return false;
921
922     /* storing using pointer - target is a pointer, type must be
923      * inferred from source
924      */
925     vtype = what->vtype;
926
927     op = type_storep_instr[vtype];
928     return ir_block_create_store_op(self, op, target, what);
929 }
930
931 bool ir_block_create_return(ir_block *self, ir_value *v)
932 {
933     ir_instr *in;
934     if (self->final) {
935         fprintf(stderr, "block already ended (%s)\n", self->label);
936         return false;
937     }
938     self->final = true;
939     self->is_return = true;
940     in = ir_instr_new(self, INSTR_RETURN);
941     if (!in)
942         return false;
943
944     if (!ir_instr_op(in, 0, v, false) ||
945         !ir_block_instr_add(self, in) )
946     {
947         return false;
948     }
949     return true;
950 }
951
952 bool ir_block_create_if(ir_block *self, ir_value *v,
953                         ir_block *ontrue, ir_block *onfalse)
954 {
955     ir_instr *in;
956     if (self->final) {
957         fprintf(stderr, "block already ended (%s)\n", self->label);
958         return false;
959     }
960     self->final = true;
961     /*in = ir_instr_new(self, (v->vtype == TYPE_STRING ? INSTR_IF_S : INSTR_IF_F));*/
962     in = ir_instr_new(self, VINSTR_COND);
963     if (!in)
964         return false;
965
966     if (!ir_instr_op(in, 0, v, false)) {
967         ir_instr_delete(in);
968         return false;
969     }
970
971     in->bops[0] = ontrue;
972     in->bops[1] = onfalse;
973
974     if (!ir_block_instr_add(self, in))
975         return false;
976
977     if (!ir_block_exits_add(self, ontrue)    ||
978         !ir_block_exits_add(self, onfalse)   ||
979         !ir_block_entries_add(ontrue, self)  ||
980         !ir_block_entries_add(onfalse, self) )
981     {
982         return false;
983     }
984     return true;
985 }
986
987 bool ir_block_create_jump(ir_block *self, ir_block *to)
988 {
989     ir_instr *in;
990     if (self->final) {
991         fprintf(stderr, "block already ended (%s)\n", self->label);
992         return false;
993     }
994     self->final = true;
995     in = ir_instr_new(self, VINSTR_JUMP);
996     if (!in)
997         return false;
998
999     in->bops[0] = to;
1000     if (!ir_block_instr_add(self, in))
1001         return false;
1002
1003     if (!ir_block_exits_add(self, to) ||
1004         !ir_block_entries_add(to, self) )
1005     {
1006         return false;
1007     }
1008     return true;
1009 }
1010
1011 bool ir_block_create_goto(ir_block *self, ir_block *to)
1012 {
1013     ir_instr *in;
1014     if (self->final) {
1015         fprintf(stderr, "block already ended (%s)\n", self->label);
1016         return false;
1017     }
1018     self->final = true;
1019     in = ir_instr_new(self, INSTR_GOTO);
1020     if (!in)
1021         return false;
1022
1023     in->bops[0] = to;
1024     if (!ir_block_instr_add(self, in))
1025         return false;
1026
1027     if (!ir_block_exits_add(self, to) ||
1028         !ir_block_entries_add(to, self) )
1029     {
1030         return false;
1031     }
1032     return true;
1033 }
1034
1035 ir_instr* ir_block_create_phi(ir_block *self, const char *label, int ot)
1036 {
1037     ir_value *out;
1038     ir_instr *in;
1039     in = ir_instr_new(self, VINSTR_PHI);
1040     if (!in)
1041         return NULL;
1042     out = ir_value_out(self->owner, label, store_value, ot);
1043     if (!out) {
1044         ir_instr_delete(in);
1045         return NULL;
1046     }
1047     if (!ir_instr_op(in, 0, out, true)) {
1048         ir_instr_delete(in);
1049         ir_value_delete(out);
1050         return NULL;
1051     }
1052     if (!ir_block_instr_add(self, in)) {
1053         ir_instr_delete(in);
1054         ir_value_delete(out);
1055         return NULL;
1056     }
1057     return in;
1058 }
1059
1060 ir_value* ir_phi_value(ir_instr *self)
1061 {
1062     return self->_ops[0];
1063 }
1064
1065 bool ir_phi_add(ir_instr* self, ir_block *b, ir_value *v)
1066 {
1067     ir_phi_entry_t pe;
1068
1069     if (!ir_block_entries_find(self->owner, b, NULL)) {
1070         /* Must not be possible to cause this, otherwise the AST
1071          * is doing something wrong.
1072          */
1073         fprintf(stderr, "Invalid entry block for PHI\n");
1074         abort();
1075     }
1076
1077     pe.value = v;
1078     pe.from = b;
1079     if (!ir_value_reads_add(v, self))
1080         return false;
1081     return ir_instr_phi_add(self, pe);
1082 }
1083
1084 /* call related code */
1085 ir_instr* ir_block_create_call(ir_block *self, const char *label, ir_value *func)
1086 {
1087     ir_value *out;
1088     ir_instr *in;
1089     in = ir_instr_new(self, INSTR_CALL0);
1090     if (!in)
1091         return NULL;
1092     out = ir_value_out(self->owner, label, store_return, func->outtype);
1093     if (!out) {
1094         ir_instr_delete(in);
1095         return NULL;
1096     }
1097     if (!ir_instr_op(in, 0, out, true) ||
1098         !ir_instr_op(in, 1, func, false) ||
1099         !ir_block_instr_add(self, in))
1100     {
1101         ir_instr_delete(in);
1102         ir_value_delete(out);
1103         return NULL;
1104     }
1105     return in;
1106 }
1107
1108 ir_value* ir_call_value(ir_instr *self)
1109 {
1110     return self->_ops[0];
1111 }
1112
1113 bool ir_call_param(ir_instr* self, ir_value *v)
1114 {
1115     if (!ir_instr_params_add(self, v))
1116         return false;
1117     if (!ir_value_reads_add(v, self)) {
1118         if (!ir_instr_params_remove(self, self->params_count-1))
1119             GMQCC_SUPPRESS_EMPTY_BODY;
1120         return false;
1121     }
1122     return true;
1123 }
1124
1125 /* binary op related code */
1126
1127 ir_value* ir_block_create_binop(ir_block *self,
1128                                 const char *label, int opcode,
1129                                 ir_value *left, ir_value *right)
1130 {
1131     int ot = TYPE_VOID;
1132     switch (opcode) {
1133         case INSTR_ADD_F:
1134         case INSTR_SUB_F:
1135         case INSTR_DIV_F:
1136         case INSTR_MUL_F:
1137         case INSTR_MUL_V:
1138         case INSTR_AND:
1139         case INSTR_OR:
1140 #if 0
1141         case INSTR_AND_I:
1142         case INSTR_AND_IF:
1143         case INSTR_AND_FI:
1144         case INSTR_OR_I:
1145         case INSTR_OR_IF:
1146         case INSTR_OR_FI:
1147 #endif
1148         case INSTR_BITAND:
1149         case INSTR_BITOR:
1150 #if 0
1151         case INSTR_SUB_S: /* -- offset of string as float */
1152         case INSTR_MUL_IF:
1153         case INSTR_MUL_FI:
1154         case INSTR_DIV_IF:
1155         case INSTR_DIV_FI:
1156         case INSTR_BITOR_IF:
1157         case INSTR_BITOR_FI:
1158         case INSTR_BITAND_FI:
1159         case INSTR_BITAND_IF:
1160         case INSTR_EQ_I:
1161         case INSTR_NE_I:
1162 #endif
1163             ot = TYPE_FLOAT;
1164             break;
1165 #if 0
1166         case INSTR_ADD_I:
1167         case INSTR_ADD_IF:
1168         case INSTR_ADD_FI:
1169         case INSTR_SUB_I:
1170         case INSTR_SUB_FI:
1171         case INSTR_SUB_IF:
1172         case INSTR_MUL_I:
1173         case INSTR_DIV_I:
1174         case INSTR_BITAND_I:
1175         case INSTR_BITOR_I:
1176         case INSTR_XOR_I:
1177         case INSTR_RSHIFT_I:
1178         case INSTR_LSHIFT_I:
1179             ot = TYPE_INTEGER;
1180             break;
1181 #endif
1182         case INSTR_ADD_V:
1183         case INSTR_SUB_V:
1184         case INSTR_MUL_VF:
1185         case INSTR_MUL_FV:
1186 #if 0
1187         case INSTR_DIV_VF:
1188         case INSTR_MUL_IV:
1189         case INSTR_MUL_VI:
1190 #endif
1191             ot = TYPE_VECTOR;
1192             break;
1193 #if 0
1194         case INSTR_ADD_SF:
1195             ot = TYPE_POINTER;
1196             break;
1197 #endif
1198         default:
1199             /* ranges: */
1200             /* boolean operations result in floats */
1201             if (opcode >= INSTR_EQ_F && opcode <= INSTR_GT)
1202                 ot = TYPE_FLOAT;
1203             else if (opcode >= INSTR_LE && opcode <= INSTR_GT)
1204                 ot = TYPE_FLOAT;
1205 #if 0
1206             else if (opcode >= INSTR_LE_I && opcode <= INSTR_EQ_FI)
1207                 ot = TYPE_FLOAT;
1208 #endif
1209             break;
1210     };
1211     if (ot == TYPE_VOID) {
1212         /* The AST or parser were supposed to check this! */
1213         return NULL;
1214     }
1215
1216     return ir_block_create_general_instr(self, label, opcode, left, right, ot);
1217 }
1218
1219 ir_value* ir_block_create_general_instr(ir_block *self, const char *label,
1220                                         int op, ir_value *a, ir_value *b, int outype)
1221 {
1222     ir_instr *instr;
1223     ir_value *out;
1224
1225     out = ir_value_out(self->owner, label, store_value, outype);
1226     if (!out)
1227         return NULL;
1228
1229     instr = ir_instr_new(self, op);
1230     if (!instr) {
1231         ir_value_delete(out);
1232         return NULL;
1233     }
1234
1235     if (!ir_instr_op(instr, 0, out, true) ||
1236         !ir_instr_op(instr, 1, a, false) ||
1237         !ir_instr_op(instr, 2, b, false) )
1238     {
1239         goto on_error;
1240     }
1241
1242     if (!ir_block_instr_add(self, instr))
1243         goto on_error;
1244
1245     return out;
1246 on_error:
1247     ir_instr_delete(instr);
1248     ir_value_delete(out);
1249     return NULL;
1250 }
1251
1252 ir_value* ir_block_create_fieldaddress(ir_block *self, const char *label, ir_value *ent, ir_value *field)
1253 {
1254     /* Support for various pointer types todo if so desired */
1255     if (ent->vtype != TYPE_ENTITY)
1256         return NULL;
1257
1258     if (field->vtype != TYPE_FIELD)
1259         return NULL;
1260
1261     return ir_block_create_general_instr(self, label, INSTR_ADDRESS, ent, field, TYPE_POINTER);
1262 }
1263
1264 ir_value* ir_block_create_load_from_ent(ir_block *self, const char *label, ir_value *ent, ir_value *field, int outype)
1265 {
1266     int op;
1267     if (ent->vtype != TYPE_ENTITY)
1268         return NULL;
1269
1270     /* at some point we could redirect for TYPE_POINTER... but that could lead to carelessness */
1271     if (field->vtype != TYPE_FIELD)
1272         return NULL;
1273
1274     switch (outype)
1275     {
1276         case TYPE_FLOAT:   op = INSTR_LOAD_F;   break;
1277         case TYPE_VECTOR:  op = INSTR_LOAD_V;   break;
1278         case TYPE_STRING:  op = INSTR_LOAD_S;   break;
1279         case TYPE_FIELD:   op = INSTR_LOAD_FLD; break;
1280         case TYPE_ENTITY:  op = INSTR_LOAD_ENT; break;
1281 #if 0
1282         case TYPE_POINTER: op = INSTR_LOAD_I;   break;
1283         case TYPE_INTEGER: op = INSTR_LOAD_I;   break;
1284 #endif
1285         case TYPE_QUATERNION: op = INSTR_LOAD_Q; break;
1286         case TYPE_MATRIX:     op = INSTR_LOAD_M; break;
1287         default:
1288             return NULL;
1289     }
1290
1291     return ir_block_create_general_instr(self, label, op, ent, field, outype);
1292 }
1293
1294 ir_value* ir_block_create_add(ir_block *self,
1295                               const char *label,
1296                               ir_value *left, ir_value *right)
1297 {
1298     int op = 0;
1299     int l = left->vtype;
1300     int r = right->vtype;
1301     if (l == r) {
1302         switch (l) {
1303             default:
1304                 return NULL;
1305             case TYPE_FLOAT:
1306                 op = INSTR_ADD_F;
1307                 break;
1308 #if 0
1309             case TYPE_INTEGER:
1310                 op = INSTR_ADD_I;
1311                 break;
1312 #endif
1313             case TYPE_VECTOR:
1314                 op = INSTR_ADD_V;
1315                 break;
1316         }
1317     } else {
1318 #if 0
1319         if ( (l == TYPE_FLOAT && r == TYPE_INTEGER) )
1320             op = INSTR_ADD_FI;
1321         else if ( (l == TYPE_INTEGER && r == TYPE_FLOAT) )
1322             op = INSTR_ADD_IF;
1323         else
1324 #endif
1325             return NULL;
1326     }
1327     return ir_block_create_binop(self, label, op, left, right);
1328 }
1329
1330 ir_value* ir_block_create_sub(ir_block *self,
1331                               const char *label,
1332                               ir_value *left, ir_value *right)
1333 {
1334     int op = 0;
1335     int l = left->vtype;
1336     int r = right->vtype;
1337     if (l == r) {
1338
1339         switch (l) {
1340             default:
1341                 return NULL;
1342             case TYPE_FLOAT:
1343                 op = INSTR_SUB_F;
1344                 break;
1345 #if 0
1346             case TYPE_INTEGER:
1347                 op = INSTR_SUB_I;
1348                 break;
1349 #endif
1350             case TYPE_VECTOR:
1351                 op = INSTR_SUB_V;
1352                 break;
1353         }
1354     } else {
1355 #if 0
1356         if ( (l == TYPE_FLOAT && r == TYPE_INTEGER) )
1357             op = INSTR_SUB_FI;
1358         else if ( (l == TYPE_INTEGER && r == TYPE_FLOAT) )
1359             op = INSTR_SUB_IF;
1360         else
1361 #endif
1362             return NULL;
1363     }
1364     return ir_block_create_binop(self, label, op, left, right);
1365 }
1366
1367 ir_value* ir_block_create_mul(ir_block *self,
1368                               const char *label,
1369                               ir_value *left, ir_value *right)
1370 {
1371     int op = 0;
1372     int l = left->vtype;
1373     int r = right->vtype;
1374     if (l == r) {
1375
1376         switch (l) {
1377             default:
1378                 return NULL;
1379             case TYPE_FLOAT:
1380                 op = INSTR_MUL_F;
1381                 break;
1382 #if 0
1383             case TYPE_INTEGER:
1384                 op = INSTR_MUL_I;
1385                 break;
1386 #endif
1387             case TYPE_VECTOR:
1388                 op = INSTR_MUL_V;
1389                 break;
1390             case TYPE_QUATERNION:
1391                 op = INSTR_MUL_Q;
1392                 break;
1393             case TYPE_MATRIX:
1394                 op = INSTR_MUL_M;
1395                 break;
1396         }
1397     } else {
1398         if ( (l == TYPE_VECTOR && r == TYPE_FLOAT) )
1399             op = INSTR_MUL_VF;
1400         else if ( (l == TYPE_FLOAT && r == TYPE_VECTOR) )
1401             op = INSTR_MUL_FV;
1402         else if ( (l == TYPE_QUATERNION && r == TYPE_FLOAT) )
1403             op = INSTR_MUL_QF;
1404         else if ( (l == TYPE_MATRIX && r == TYPE_FLOAT) )
1405             op = INSTR_MUL_MF;
1406 #if 0
1407         else if ( (l == TYPE_VECTOR && r == TYPE_INTEGER) )
1408             op = INSTR_MUL_VI;
1409         else if ( (l == TYPE_INTEGER && r == TYPE_VECTOR) )
1410             op = INSTR_MUL_IV;
1411         else if ( (l == TYPE_FLOAT && r == TYPE_INTEGER) )
1412             op = INSTR_MUL_FI;
1413         else if ( (l == TYPE_INTEGER && r == TYPE_FLOAT) )
1414             op = INSTR_MUL_IF;
1415 #endif
1416         else
1417             return NULL;
1418     }
1419     return ir_block_create_binop(self, label, op, left, right);
1420 }
1421
1422 ir_value* ir_block_create_div(ir_block *self,
1423                               const char *label,
1424                               ir_value *left, ir_value *right)
1425 {
1426     int op = 0;
1427     int l = left->vtype;
1428     int r = right->vtype;
1429     if (l == r) {
1430
1431         switch (l) {
1432             default:
1433                 return NULL;
1434             case TYPE_FLOAT:
1435                 op = INSTR_DIV_F;
1436                 break;
1437 #if 0
1438             case TYPE_INTEGER:
1439                 op = INSTR_DIV_I;
1440                 break;
1441 #endif
1442         }
1443     } else {
1444 #if 0
1445         if ( (l == TYPE_VECTOR && r == TYPE_FLOAT) )
1446             op = INSTR_DIV_VF;
1447         else if ( (l == TYPE_FLOAT && r == TYPE_INTEGER) )
1448             op = INSTR_DIV_FI;
1449         else if ( (l == TYPE_INTEGER && r == TYPE_FLOAT) )
1450             op = INSTR_DIV_IF;
1451         else
1452 #endif
1453             return NULL;
1454     }
1455     return ir_block_create_binop(self, label, op, left, right);
1456 }
1457
1458 /* PHI resolving breaks the SSA, and must thus be the last
1459  * step before life-range calculation.
1460  */
1461
1462 static bool ir_block_naive_phi(ir_block *self);
1463 bool ir_function_naive_phi(ir_function *self)
1464 {
1465     size_t i;
1466
1467     for (i = 0; i < self->blocks_count; ++i)
1468     {
1469         if (!ir_block_naive_phi(self->blocks[i]))
1470             return false;
1471     }
1472     return true;
1473 }
1474
1475 static bool ir_naive_phi_emit_store(ir_block *block, size_t iid, ir_value *old, ir_value *what)
1476 {
1477     ir_instr *instr;
1478     size_t i;
1479
1480     /* create a store */
1481     if (!ir_block_create_store(block, old, what))
1482         return false;
1483
1484     /* we now move it up */
1485     instr = block->instr[block->instr_count-1];
1486     for (i = block->instr_count; i > iid; --i)
1487         block->instr[i] = block->instr[i-1];
1488     block->instr[i] = instr;
1489
1490     return true;
1491 }
1492
1493 static bool ir_block_naive_phi(ir_block *self)
1494 {
1495     size_t i, p, w;
1496     /* FIXME: optionally, create_phi can add the phis
1497      * to a list so we don't need to loop through blocks
1498      * - anyway: "don't optimize YET"
1499      */
1500     for (i = 0; i < self->instr_count; ++i)
1501     {
1502         ir_instr *instr = self->instr[i];
1503         if (instr->opcode != VINSTR_PHI)
1504             continue;
1505
1506         if (!ir_block_instr_remove(self, i))
1507             return false;
1508         --i; /* NOTE: i+1 below */
1509
1510         for (p = 0; p < instr->phi_count; ++p)
1511         {
1512             ir_value *v = instr->phi[p].value;
1513             for (w = 0; w < v->writes_count; ++w) {
1514                 ir_value *old;
1515
1516                 if (!v->writes[w]->_ops[0])
1517                     continue;
1518
1519                 /* When the write was to a global, we have to emit a mov */
1520                 old = v->writes[w]->_ops[0];
1521
1522                 /* The original instruction now writes to the PHI target local */
1523                 if (v->writes[w]->_ops[0] == v)
1524                     v->writes[w]->_ops[0] = instr->_ops[0];
1525
1526                 if (old->store != store_value && old->store != store_local && old->store != store_param)
1527                 {
1528                     /* If it originally wrote to a global we need to store the value
1529                      * there as welli
1530                      */
1531                     if (!ir_naive_phi_emit_store(self, i+1, old, v))
1532                         return false;
1533                     if (i+1 < self->instr_count)
1534                         instr = self->instr[i+1];
1535                     else
1536                         instr = NULL;
1537                     /* In case I forget and access instr later, it'll be NULL
1538                      * when it's a problem, to make sure we crash, rather than accessing
1539                      * invalid data.
1540                      */
1541                 }
1542                 else
1543                 {
1544                     /* If it didn't, we can replace all reads by the phi target now. */
1545                     size_t r;
1546                     for (r = 0; r < old->reads_count; ++r)
1547                     {
1548                         size_t op;
1549                         ir_instr *ri = old->reads[r];
1550                         for (op = 0; op < ri->phi_count; ++op) {
1551                             if (ri->phi[op].value == old)
1552                                 ri->phi[op].value = v;
1553                         }
1554                         for (op = 0; op < 3; ++op) {
1555                             if (ri->_ops[op] == old)
1556                                 ri->_ops[op] = v;
1557                         }
1558                     }
1559                 }
1560             }
1561         }
1562         ir_instr_delete(instr);
1563     }
1564     return true;
1565 }
1566
1567 /***********************************************************************
1568  *IR Temp allocation code
1569  * Propagating value life ranges by walking through the function backwards
1570  * until no more changes are made.
1571  * In theory this should happen once more than once for every nested loop
1572  * level.
1573  * Though this implementation might run an additional time for if nests.
1574  */
1575
1576 typedef struct
1577 {
1578     ir_value* *v;
1579     size_t    v_count;
1580     size_t    v_alloc;
1581 } new_reads_t;
1582 MEM_VEC_FUNCTIONS_ALL(new_reads_t, ir_value*, v)
1583
1584 /* Enumerate instructions used by value's life-ranges
1585  */
1586 static void ir_block_enumerate(ir_block *self, size_t *_eid)
1587 {
1588     size_t i;
1589     size_t eid = *_eid;
1590     for (i = 0; i < self->instr_count; ++i)
1591     {
1592         self->instr[i]->eid = eid++;
1593     }
1594     *_eid = eid;
1595 }
1596
1597 /* Enumerate blocks and instructions.
1598  * The block-enumeration is unordered!
1599  * We do not really use the block enumreation, however
1600  * the instruction enumeration is important for life-ranges.
1601  */
1602 void ir_function_enumerate(ir_function *self)
1603 {
1604     size_t i;
1605     size_t instruction_id = 0;
1606     for (i = 0; i < self->blocks_count; ++i)
1607     {
1608         self->blocks[i]->eid = i;
1609         self->blocks[i]->run_id = 0;
1610         ir_block_enumerate(self->blocks[i], &instruction_id);
1611     }
1612 }
1613
1614 static bool ir_block_life_propagate(ir_block *b, ir_block *prev, bool *changed);
1615 bool ir_function_calculate_liferanges(ir_function *self)
1616 {
1617     size_t i;
1618     bool changed;
1619
1620     do {
1621         self->run_id++;
1622         changed = false;
1623         for (i = 0; i != self->blocks_count; ++i)
1624         {
1625             if (self->blocks[i]->is_return)
1626             {
1627                 if (!ir_block_life_propagate(self->blocks[i], NULL, &changed))
1628                     return false;
1629             }
1630         }
1631     } while (changed);
1632     return true;
1633 }
1634
1635 /* Local-value allocator
1636  * After finishing creating the liferange of all values used in a function
1637  * we can allocate their global-positions.
1638  * This is the counterpart to register-allocation in register machines.
1639  */
1640 typedef struct {
1641     MEM_VECTOR_MAKE(ir_value*, locals);
1642     MEM_VECTOR_MAKE(size_t,    sizes);
1643     MEM_VECTOR_MAKE(size_t,    positions);
1644 } function_allocator;
1645 MEM_VEC_FUNCTIONS(function_allocator, ir_value*, locals)
1646 MEM_VEC_FUNCTIONS(function_allocator, size_t,    sizes)
1647 MEM_VEC_FUNCTIONS(function_allocator, size_t,    positions)
1648
1649 static bool function_allocator_alloc(function_allocator *alloc, const ir_value *var)
1650 {
1651     ir_value *slot;
1652     size_t vsize = type_sizeof[var->vtype];
1653
1654     slot = ir_value_var("reg", store_global, var->vtype);
1655     if (!slot)
1656         return false;
1657
1658     if (!ir_value_life_merge_into(slot, var))
1659         goto localerror;
1660
1661     if (!function_allocator_locals_add(alloc, slot))
1662         goto localerror;
1663
1664     if (!function_allocator_sizes_add(alloc, vsize))
1665         goto localerror;
1666
1667     return true;
1668
1669 localerror:
1670     ir_value_delete(slot);
1671     return false;
1672 }
1673
1674 bool ir_function_allocate_locals(ir_function *self)
1675 {
1676     size_t i, a;
1677     bool   retval = true;
1678     size_t pos;
1679
1680     ir_value *slot;
1681     const ir_value *v;
1682
1683     function_allocator alloc;
1684
1685     if (!self->locals_count)
1686         return true;
1687
1688     MEM_VECTOR_INIT(&alloc, locals);
1689     MEM_VECTOR_INIT(&alloc, sizes);
1690     MEM_VECTOR_INIT(&alloc, positions);
1691
1692     for (i = 0; i < self->locals_count; ++i)
1693     {
1694         if (!function_allocator_alloc(&alloc, self->locals[i]))
1695             goto error;
1696     }
1697
1698     /* Allocate a slot for any value that still exists */
1699     for (i = 0; i < self->values_count; ++i)
1700     {
1701         v = self->values[i];
1702
1703         if (!v->life_count)
1704             continue;
1705
1706         for (a = 0; a < alloc.locals_count; ++a)
1707         {
1708             slot = alloc.locals[a];
1709
1710             if (ir_values_overlap(v, slot))
1711                 continue;
1712
1713             if (!ir_value_life_merge_into(slot, v))
1714                 goto error;
1715
1716             /* adjust size for this slot */
1717             if (alloc.sizes[a] < type_sizeof[v->vtype])
1718                 alloc.sizes[a] = type_sizeof[v->vtype];
1719
1720             self->values[i]->code.local = a;
1721             break;
1722         }
1723         if (a >= alloc.locals_count) {
1724             self->values[i]->code.local = alloc.locals_count;
1725             if (!function_allocator_alloc(&alloc, v))
1726                 goto error;
1727         }
1728     }
1729
1730     /* Adjust slot positions based on sizes */
1731     if (!function_allocator_positions_add(&alloc, 0))
1732         goto error;
1733
1734     if (alloc.sizes_count)
1735         pos = alloc.positions[0] + alloc.sizes[0];
1736     else
1737         pos = 0;
1738     for (i = 1; i < alloc.sizes_count; ++i)
1739     {
1740         pos = alloc.positions[i-1] + alloc.sizes[i-1];
1741         if (!function_allocator_positions_add(&alloc, pos))
1742             goto error;
1743     }
1744
1745     self->allocated_locals = pos + alloc.sizes[alloc.sizes_count-1];
1746
1747     /* Take over the actual slot positions */
1748     for (i = 0; i < self->values_count; ++i)
1749         self->values[i]->code.local = alloc.positions[self->values[i]->code.local];
1750
1751     goto cleanup;
1752
1753 error:
1754     retval = false;
1755 cleanup:
1756     for (i = 0; i < alloc.locals_count; ++i)
1757         ir_value_delete(alloc.locals[i]);
1758     MEM_VECTOR_CLEAR(&alloc, locals);
1759     MEM_VECTOR_CLEAR(&alloc, sizes);
1760     MEM_VECTOR_CLEAR(&alloc, positions);
1761     return retval;
1762 }
1763
1764 /* Get information about which operand
1765  * is read from, or written to.
1766  */
1767 static void ir_op_read_write(int op, size_t *read, size_t *write)
1768 {
1769     switch (op)
1770     {
1771     case VINSTR_JUMP:
1772     case INSTR_GOTO:
1773         *write = 0;
1774         *read = 0;
1775         break;
1776     case INSTR_IF:
1777     case INSTR_IFNOT:
1778 #if 0
1779     case INSTR_IF_S:
1780     case INSTR_IFNOT_S:
1781 #endif
1782     case INSTR_RETURN:
1783     case VINSTR_COND:
1784         *write = 0;
1785         *read = 1;
1786         break;
1787     default:
1788         *write = 1;
1789         *read = 6;
1790         break;
1791     };
1792 }
1793
1794 static bool ir_block_living_add_instr(ir_block *self, size_t eid)
1795 {
1796     size_t i;
1797     bool changed = false;
1798     bool tempbool;
1799     for (i = 0; i != self->living_count; ++i)
1800     {
1801         tempbool = ir_value_life_merge(self->living[i], eid);
1802         /* debug
1803         if (tempbool)
1804             fprintf(stderr, "block_living_add_instr() value instruction added %s: %i\n", self->living[i]->_name, (int)eid);
1805         */
1806         changed = changed || tempbool;
1807     }
1808     return changed;
1809 }
1810
1811 static bool ir_block_life_prop_previous(ir_block* self, ir_block *prev, bool *changed)
1812 {
1813     size_t i;
1814     /* values which have been read in a previous iteration are now
1815      * in the "living" array even if the previous block doesn't use them.
1816      * So we have to remove whatever does not exist in the previous block.
1817      * They will be re-added on-read, but the liferange merge won't cause
1818      * a change.
1819      */
1820     for (i = 0; i < self->living_count; ++i)
1821     {
1822         if (!ir_block_living_find(prev, self->living[i], NULL)) {
1823             if (!ir_block_living_remove(self, i))
1824                 return false;
1825             --i;
1826         }
1827     }
1828
1829     /* Whatever the previous block still has in its living set
1830      * must now be added to ours as well.
1831      */
1832     for (i = 0; i < prev->living_count; ++i)
1833     {
1834         if (ir_block_living_find(self, prev->living[i], NULL))
1835             continue;
1836         if (!ir_block_living_add(self, prev->living[i]))
1837             return false;
1838         /*
1839         printf("%s got from prev: %s\n", self->label, prev->living[i]->_name);
1840         */
1841     }
1842     return true;
1843 }
1844
1845 static bool ir_block_life_propagate(ir_block *self, ir_block *prev, bool *changed)
1846 {
1847     ir_instr *instr;
1848     ir_value *value;
1849     bool  tempbool;
1850     size_t i, o, p;
1851     /* bitmasks which operands are read from or written to */
1852     size_t read, write;
1853 #if defined(LIFE_RANGE_WITHOUT_LAST_READ)
1854     size_t rd;
1855     new_reads_t new_reads;
1856 #endif
1857     char dbg_ind[16] = { '#', '0' };
1858     (void)dbg_ind;
1859
1860 #if defined(LIFE_RANGE_WITHOUT_LAST_READ)
1861     MEM_VECTOR_INIT(&new_reads, v);
1862 #endif
1863
1864     if (prev)
1865     {
1866         if (!ir_block_life_prop_previous(self, prev, changed))
1867             return false;
1868     }
1869
1870     i = self->instr_count;
1871     while (i)
1872     { --i;
1873         instr = self->instr[i];
1874
1875         /* PHI operands are always read operands */
1876         for (p = 0; p < instr->phi_count; ++p)
1877         {
1878             value = instr->phi[p].value;
1879 #if ! defined(LIFE_RANGE_WITHOUT_LAST_READ)
1880             if (!ir_block_living_find(self, value, NULL) &&
1881                 !ir_block_living_add(self, value))
1882             {
1883                 goto on_error;
1884             }
1885 #else
1886             if (!new_reads_t_v_find(&new_reads, value, NULL))
1887             {
1888                 if (!new_reads_t_v_add(&new_reads, value))
1889                     goto on_error;
1890             }
1891 #endif
1892         }
1893
1894         /* See which operands are read and write operands */
1895         ir_op_read_write(instr->opcode, &read, &write);
1896
1897         /* Go through the 3 main operands */
1898         for (o = 0; o < 3; ++o)
1899         {
1900             if (!instr->_ops[o]) /* no such operand */
1901                 continue;
1902
1903             value = instr->_ops[o];
1904
1905             /* We only care about locals */
1906             /* we also calculate parameter liferanges so that locals
1907              * can take up parameter slots */
1908             if (value->store != store_value &&
1909                 value->store != store_local &&
1910                 value->store != store_param)
1911                 continue;
1912
1913             /* read operands */
1914             if (read & (1<<o))
1915             {
1916 #if ! defined(LIFE_RANGE_WITHOUT_LAST_READ)
1917                 if (!ir_block_living_find(self, value, NULL) &&
1918                     !ir_block_living_add(self, value))
1919                 {
1920                     goto on_error;
1921                 }
1922 #else
1923                 /* fprintf(stderr, "read: %s\n", value->_name); */
1924                 if (!new_reads_t_v_find(&new_reads, value, NULL))
1925                 {
1926                     if (!new_reads_t_v_add(&new_reads, value))
1927                         goto on_error;
1928                 }
1929 #endif
1930             }
1931
1932             /* write operands */
1933             /* When we write to a local, we consider it "dead" for the
1934              * remaining upper part of the function, since in SSA a value
1935              * can only be written once (== created)
1936              */
1937             if (write & (1<<o))
1938             {
1939                 size_t idx;
1940                 bool in_living = ir_block_living_find(self, value, &idx);
1941 #if defined(LIFE_RANGE_WITHOUT_LAST_READ)
1942                 size_t readidx;
1943                 bool in_reads = new_reads_t_v_find(&new_reads, value, &readidx);
1944                 if (!in_living && !in_reads)
1945 #else
1946                 if (!in_living)
1947 #endif
1948                 {
1949                     /* If the value isn't alive it hasn't been read before... */
1950                     /* TODO: See if the warning can be emitted during parsing or AST processing
1951                      * otherwise have warning printed here.
1952                      * IF printing a warning here: include filecontext_t,
1953                      * and make sure it's only printed once
1954                      * since this function is run multiple times.
1955                      */
1956                     /* For now: debug info: */
1957                     fprintf(stderr, "Value only written %s\n", value->name);
1958                     tempbool = ir_value_life_merge(value, instr->eid);
1959                     *changed = *changed || tempbool;
1960                     /*
1961                     ir_instr_dump(instr, dbg_ind, printf);
1962                     abort();
1963                     */
1964                 } else {
1965                     /* since 'living' won't contain it
1966                      * anymore, merge the value, since
1967                      * (A) doesn't.
1968                      */
1969                     tempbool = ir_value_life_merge(value, instr->eid);
1970                     /*
1971                     if (tempbool)
1972                         fprintf(stderr, "value added id %s %i\n", value->name, (int)instr->eid);
1973                     */
1974                     *changed = *changed || tempbool;
1975                     /* Then remove */
1976 #if ! defined(LIFE_RANGE_WITHOUT_LAST_READ)
1977                     if (!ir_block_living_remove(self, idx))
1978                         goto on_error;
1979 #else
1980                     if (in_reads)
1981                     {
1982                         if (!new_reads_t_v_remove(&new_reads, readidx))
1983                             goto on_error;
1984                     }
1985 #endif
1986                 }
1987             }
1988         }
1989         /* (A) */
1990         tempbool = ir_block_living_add_instr(self, instr->eid);
1991         /*fprintf(stderr, "living added values\n");*/
1992         *changed = *changed || tempbool;
1993
1994 #if defined(LIFE_RANGE_WITHOUT_LAST_READ)
1995         /* new reads: */
1996         for (rd = 0; rd < new_reads.v_count; ++rd)
1997         {
1998             if (!ir_block_living_find(self, new_reads.v[rd], NULL)) {
1999                 if (!ir_block_living_add(self, new_reads.v[rd]))
2000                     goto on_error;
2001             }
2002             if (!i && !self->entries_count) {
2003                 /* fix the top */
2004                 *changed = *changed || ir_value_life_merge(new_reads.v[rd], instr->eid);
2005             }
2006         }
2007         MEM_VECTOR_CLEAR(&new_reads, v);
2008 #endif
2009     }
2010
2011     if (self->run_id == self->owner->run_id)
2012         return true;
2013
2014     self->run_id = self->owner->run_id;
2015
2016     for (i = 0; i < self->entries_count; ++i)
2017     {
2018         ir_block *entry = self->entries[i];
2019         ir_block_life_propagate(entry, self, changed);
2020     }
2021
2022     return true;
2023 on_error:
2024 #if defined(LIFE_RANGE_WITHOUT_LAST_READ)
2025     MEM_VECTOR_CLEAR(&new_reads, v);
2026 #endif
2027     return false;
2028 }
2029
2030 /***********************************************************************
2031  *IR Code-Generation
2032  *
2033  * Since the IR has the convention of putting 'write' operands
2034  * at the beginning, we have to rotate the operands of instructions
2035  * properly in order to generate valid QCVM code.
2036  *
2037  * Having destinations at a fixed position is more convenient. In QC
2038  * this is *mostly* OPC,  but FTE adds at least 2 instructions which
2039  * read from from OPA,  and store to OPB rather than OPC.   Which is
2040  * partially the reason why the implementation of these instructions
2041  * in darkplaces has been delayed for so long.
2042  *
2043  * Breaking conventions is annoying...
2044  */
2045 static bool ir_builder_gen_global(ir_builder *self, ir_value *global);
2046
2047 static bool gen_global_field(ir_value *global)
2048 {
2049     if (global->isconst)
2050     {
2051         ir_value *fld = global->constval.vpointer;
2052         if (!fld) {
2053             printf("Invalid field constant with no field: %s\n", global->name);
2054             return false;
2055         }
2056
2057         /* Now, in this case, a relocation would be impossible to code
2058          * since it looks like this:
2059          * .vector v = origin;     <- parse error, wtf is 'origin'?
2060          * .vector origin;
2061          *
2062          * But we will need a general relocation support later anyway
2063          * for functions... might as well support that here.
2064          */
2065         if (!fld->code.globaladdr) {
2066             printf("FIXME: Relocation support\n");
2067             return false;
2068         }
2069
2070         /* copy the field's value */
2071         global->code.globaladdr = code_globals_add(code_globals_data[fld->code.globaladdr]);
2072     }
2073     else
2074     {
2075         prog_section_field fld;
2076
2077         fld.name = global->code.name;
2078         fld.offset = code_fields_elements;
2079         fld.type = global->fieldtype;
2080
2081         if (fld.type == TYPE_VOID) {
2082             printf("Field is missing a type: %s\n", global->name);
2083             return false;
2084         }
2085
2086         if (code_fields_add(fld) < 0)
2087             return false;
2088
2089         global->code.globaladdr = code_globals_add(fld.offset);
2090     }
2091     if (global->code.globaladdr < 0)
2092         return false;
2093     return true;
2094 }
2095
2096 static bool gen_global_pointer(ir_value *global)
2097 {
2098     if (global->isconst)
2099     {
2100         ir_value *target = global->constval.vpointer;
2101         if (!target) {
2102             printf("Invalid pointer constant: %s\n", global->name);
2103             /* NULL pointers are pointing to the NULL constant, which also
2104              * sits at address 0, but still has an ir_value for itself.
2105              */
2106             return false;
2107         }
2108
2109         /* Here, relocations ARE possible - in fteqcc-enhanced-qc:
2110          * void() foo; <- proto
2111          * void() *fooptr = &foo;
2112          * void() foo = { code }
2113          */
2114         if (!target->code.globaladdr) {
2115             /* FIXME: Check for the constant nullptr ir_value!
2116              * because then code.globaladdr being 0 is valid.
2117              */
2118             printf("FIXME: Relocation support\n");
2119             return false;
2120         }
2121
2122         global->code.globaladdr = code_globals_add(target->code.globaladdr);
2123     }
2124     else
2125     {
2126         global->code.globaladdr = code_globals_add(0);
2127     }
2128     if (global->code.globaladdr < 0)
2129         return false;
2130     return true;
2131 }
2132
2133 static bool gen_blocks_recursive(ir_function *func, ir_block *block)
2134 {
2135     prog_section_statement stmt;
2136     ir_instr *instr;
2137     ir_block *target;
2138     ir_block *ontrue;
2139     ir_block *onfalse;
2140     size_t    stidx;
2141     size_t    i;
2142
2143 tailcall:
2144     block->generated = true;
2145     block->code_start = code_statements_elements;
2146     for (i = 0; i < block->instr_count; ++i)
2147     {
2148         instr = block->instr[i];
2149
2150         if (instr->opcode == VINSTR_PHI) {
2151             printf("cannot generate virtual instruction (phi)\n");
2152             return false;
2153         }
2154
2155         if (instr->opcode == VINSTR_JUMP) {
2156             target = instr->bops[0];
2157             /* for uncoditional jumps, if the target hasn't been generated
2158              * yet, we generate them right here.
2159              */
2160             if (!target->generated) {
2161                 block = target;
2162                 goto tailcall;
2163             }
2164
2165             /* otherwise we generate a jump instruction */
2166             stmt.opcode = INSTR_GOTO;
2167             stmt.o1.s1 = (target->code_start) - code_statements_elements;
2168             stmt.o2.s1 = 0;
2169             stmt.o3.s1 = 0;
2170             if (code_statements_add(stmt) < 0)
2171                 return false;
2172
2173             /* no further instructions can be in this block */
2174             return true;
2175         }
2176
2177         if (instr->opcode == VINSTR_COND) {
2178             ontrue  = instr->bops[0];
2179             onfalse = instr->bops[1];
2180             /* TODO: have the AST signal which block should
2181              * come first: eg. optimize IFs without ELSE...
2182              */
2183
2184             stmt.o1.u1 = instr->_ops[0]->code.globaladdr;
2185             stmt.o2.u1 = 0;
2186             stmt.o3.s1 = 0;
2187
2188             if (ontrue->generated) {
2189                 stmt.opcode = INSTR_IF;
2190                 stmt.o2.s1 = (ontrue->code_start-1) - code_statements_elements;
2191                 if (code_statements_add(stmt) < 0)
2192                     return false;
2193             }
2194             if (onfalse->generated) {
2195                 stmt.opcode = INSTR_IFNOT;
2196                 stmt.o2.s1 = (onfalse->code_start-1) - code_statements_elements;
2197                 if (code_statements_add(stmt) < 0)
2198                     return false;
2199             }
2200             if (!ontrue->generated) {
2201                 if (onfalse->generated) {
2202                     block = ontrue;
2203                     goto tailcall;
2204                 }
2205             }
2206             if (!onfalse->generated) {
2207                 if (ontrue->generated) {
2208                     block = onfalse;
2209                     goto tailcall;
2210                 }
2211             }
2212             /* neither ontrue nor onfalse exist */
2213             stmt.opcode = INSTR_IFNOT;
2214             stidx = code_statements_elements;
2215             if (code_statements_add(stmt) < 0)
2216                 return false;
2217             /* on false we jump, so add ontrue-path */
2218             if (!gen_blocks_recursive(func, ontrue))
2219                 return false;
2220             /* fixup the jump address */
2221             code_statements_data[stidx].o2.s1 = code_statements_elements - stidx;
2222             /* generate onfalse path */
2223             if (onfalse->generated) {
2224                 /* fixup the jump address */
2225                 code_statements_data[stidx].o2.s1 = (onfalse->code_start) - (stidx);
2226                 /* may have been generated in the previous recursive call */
2227                 stmt.opcode = INSTR_GOTO;
2228                 stmt.o1.s1 = (onfalse->code_start) - code_statements_elements;
2229                 stmt.o2.s1 = 0;
2230                 stmt.o3.s1 = 0;
2231                 return (code_statements_add(stmt) >= 0);
2232             }
2233             /* if not, generate now */
2234             block = onfalse;
2235             goto tailcall;
2236         }
2237
2238         if (instr->opcode >= INSTR_CALL0 && instr->opcode <= INSTR_CALL8) {
2239             /* Trivial call translation:
2240              * copy all params to OFS_PARM*
2241              * if the output's storetype is not store_return,
2242              * add append a STORE instruction!
2243              *
2244              * NOTES on how to do it better without much trouble:
2245              * -) The liferanges!
2246              *      Simply check the liferange of all parameters for
2247              *      other CALLs. For each param with no CALL in its
2248              *      liferange, we can store it in an OFS_PARM at
2249              *      generation already. This would even include later
2250              *      reuse.... probably... :)
2251              */
2252             size_t p;
2253             ir_value *retvalue;
2254
2255             for (p = 0; p < instr->params_count; ++p)
2256             {
2257                 ir_value *param = instr->params[p];
2258
2259                 stmt.opcode = INSTR_STORE_F;
2260                 stmt.o3.u1 = 0;
2261
2262                 stmt.opcode = type_store_instr[param->vtype];
2263                 stmt.o1.u1 = param->code.globaladdr;
2264                 stmt.o2.u1 = OFS_PARM0 + 3 * p;
2265                 if (code_statements_add(stmt) < 0)
2266                     return false;
2267             }
2268             stmt.opcode = INSTR_CALL0 + instr->params_count;
2269             if (stmt.opcode > INSTR_CALL8)
2270                 stmt.opcode = INSTR_CALL8;
2271             stmt.o1.u1 = instr->_ops[1]->code.globaladdr;
2272             stmt.o2.u1 = 0;
2273             stmt.o3.u1 = 0;
2274             if (code_statements_add(stmt) < 0)
2275                 return false;
2276
2277             retvalue = instr->_ops[0];
2278             if (retvalue && retvalue->store != store_return && retvalue->life_count)
2279             {
2280                 /* not to be kept in OFS_RETURN */
2281                 stmt.opcode = type_store_instr[retvalue->vtype];
2282                 stmt.o1.u1 = OFS_RETURN;
2283                 stmt.o2.u1 = retvalue->code.globaladdr;
2284                 stmt.o3.u1 = 0;
2285                 if (code_statements_add(stmt) < 0)
2286                     return false;
2287             }
2288             continue;
2289         }
2290
2291         if (instr->opcode == INSTR_STATE) {
2292             printf("TODO: state instruction\n");
2293             return false;
2294         }
2295
2296         stmt.opcode = instr->opcode;
2297         stmt.o1.u1 = 0;
2298         stmt.o2.u1 = 0;
2299         stmt.o3.u1 = 0;
2300
2301         /* This is the general order of operands */
2302         if (instr->_ops[0])
2303             stmt.o3.u1 = instr->_ops[0]->code.globaladdr;
2304
2305         if (instr->_ops[1])
2306             stmt.o1.u1 = instr->_ops[1]->code.globaladdr;
2307
2308         if (instr->_ops[2])
2309             stmt.o2.u1 = instr->_ops[2]->code.globaladdr;
2310
2311         if (stmt.opcode == INSTR_RETURN || stmt.opcode == INSTR_DONE)
2312         {
2313             stmt.o1.u1 = stmt.o3.u1;
2314             stmt.o3.u1 = 0;
2315         }
2316         else if ((stmt.opcode >= INSTR_STORE_F    &&
2317                   stmt.opcode <= INSTR_STORE_FNC)    ||
2318                  (stmt.opcode >= INSTR_NOT_F      &&
2319                   stmt.opcode <= INSTR_NOT_FNC))
2320         {
2321             /* 2-operand instructions with A -> B */
2322             stmt.o2.u1 = stmt.o3.u1;
2323             stmt.o3.u1 = 0;
2324         }
2325
2326         if (code_statements_add(stmt) < 0)
2327             return false;
2328     }
2329     return true;
2330 }
2331
2332 static bool gen_function_code(ir_function *self)
2333 {
2334     ir_block *block;
2335     prog_section_statement stmt;
2336
2337     /* Starting from entry point, we generate blocks "as they come"
2338      * for now. Dead blocks will not be translated obviously.
2339      */
2340     if (!self->blocks_count) {
2341         printf("Function '%s' declared without body.\n", self->name);
2342         return false;
2343     }
2344
2345     block = self->blocks[0];
2346     if (block->generated)
2347         return true;
2348
2349     if (!gen_blocks_recursive(self, block)) {
2350         printf("failed to generate blocks for '%s'\n", self->name);
2351         return false;
2352     }
2353
2354     /* otherwise code_write crashes since it debug-prints functions until AINSTR_END */
2355     stmt.opcode = AINSTR_END;
2356     stmt.o1.u1 = 0;
2357     stmt.o2.u1 = 0;
2358     stmt.o3.u1 = 0;
2359     if (code_statements_add(stmt) < 0)
2360         return false;
2361     return true;
2362 }
2363
2364 static bool gen_global_function(ir_builder *ir, ir_value *global)
2365 {
2366     prog_section_function fun;
2367     ir_function          *irfun;
2368
2369     size_t i;
2370     size_t local_var_end;
2371
2372     if (!global->isconst || (!global->constval.vfunc))
2373     {
2374         printf("Invalid state of function-global: not constant: %s\n", global->name);
2375         return false;
2376     }
2377
2378     irfun = global->constval.vfunc;
2379
2380     fun.name    = global->code.name;
2381     fun.file    = code_cachedstring(global->context.file);
2382     fun.profile = 0; /* always 0 */
2383     fun.nargs   = irfun->params_count;
2384
2385     for (i = 0;i < 8; ++i) {
2386         if (i >= fun.nargs)
2387             fun.argsize[i] = 0;
2388         else
2389             fun.argsize[i] = type_sizeof[irfun->params[i]];
2390     }
2391
2392     fun.firstlocal = code_globals_elements;
2393     fun.locals     = irfun->allocated_locals + irfun->locals_count;
2394
2395     local_var_end = 0;
2396     for (i = 0; i < irfun->locals_count; ++i) {
2397         if (!ir_builder_gen_global(ir, irfun->locals[i])) {
2398             printf("Failed to generate global %s\n", irfun->locals[i]->name);
2399             return false;
2400         }
2401     }
2402     if (irfun->locals_count) {
2403         ir_value *last = irfun->locals[irfun->locals_count-1];
2404         local_var_end = last->code.globaladdr;
2405         local_var_end += type_sizeof[last->vtype];
2406     }
2407     for (i = 0; i < irfun->values_count; ++i)
2408     {
2409         /* generate code.globaladdr for ssa values */
2410         ir_value *v = irfun->values[i];
2411         v->code.globaladdr = local_var_end + v->code.local;
2412     }
2413     for (i = 0; i < irfun->locals_count; ++i) {
2414         /* fill the locals with zeros */
2415         code_globals_add(0);
2416     }
2417
2418     if (irfun->builtin)
2419         fun.entry = irfun->builtin;
2420     else {
2421         fun.entry = code_statements_elements;
2422         if (!gen_function_code(irfun)) {
2423             printf("Failed to generate code for function %s\n", irfun->name);
2424             return false;
2425         }
2426     }
2427
2428     return (code_functions_add(fun) >= 0);
2429 }
2430
2431 static bool ir_builder_gen_global(ir_builder *self, ir_value *global)
2432 {
2433     size_t           i;
2434     int32_t         *iptr;
2435     prog_section_def def;
2436
2437     def.type   = global->vtype;
2438     def.offset = code_globals_elements;
2439     def.name   = global->code.name       = code_genstring(global->name);
2440
2441     switch (global->vtype)
2442     {
2443     case TYPE_POINTER:
2444         if (code_defs_add(def) < 0)
2445             return false;
2446         return gen_global_pointer(global);
2447     case TYPE_FIELD:
2448         if (code_defs_add(def) < 0)
2449             return false;
2450         return gen_global_field(global);
2451     case TYPE_ENTITY:
2452         /* fall through */
2453     case TYPE_FLOAT:
2454     {
2455         if (code_defs_add(def) < 0)
2456             return false;
2457
2458         if (global->isconst) {
2459             iptr = (int32_t*)&global->constval.vfloat;
2460             global->code.globaladdr = code_globals_add(*iptr);
2461         } else
2462             global->code.globaladdr = code_globals_add(0);
2463
2464         return global->code.globaladdr >= 0;
2465     }
2466     case TYPE_STRING:
2467     {
2468         if (code_defs_add(def) < 0)
2469             return false;
2470         if (global->isconst)
2471             global->code.globaladdr = code_globals_add(code_cachedstring(global->constval.vstring));
2472         else
2473             global->code.globaladdr = code_globals_add(0);
2474         return global->code.globaladdr >= 0;
2475     }
2476     case TYPE_VECTOR:
2477     case TYPE_QUATERNION:
2478     case TYPE_MATRIX:
2479     {
2480         size_t d;
2481         if (code_defs_add(def) < 0)
2482             return false;
2483
2484         if (global->isconst) {
2485             iptr = (int32_t*)&global->constval.vvec;
2486             global->code.globaladdr = code_globals_add(iptr[0]);
2487             if (global->code.globaladdr < 0)
2488                 return false;
2489             for (d = 1; d < type_sizeof[global->vtype]; ++d)
2490             {
2491                 if (code_globals_add(iptr[d]) < 0)
2492                     return false;
2493             }
2494         } else {
2495             global->code.globaladdr = code_globals_add(0);
2496             if (global->code.globaladdr < 0)
2497                 return false;
2498             for (d = 1; d < type_sizeof[global->vtype]; ++d)
2499             {
2500                 if (code_globals_add(0) < 0)
2501                     return false;
2502             }
2503         }
2504         return global->code.globaladdr >= 0;
2505     }
2506     case TYPE_FUNCTION:
2507         if (code_defs_add(def) < 0)
2508             return false;
2509         global->code.globaladdr = code_globals_elements;
2510         code_globals_add(code_functions_elements);
2511         return gen_global_function(self, global);
2512     case TYPE_VARIANT:
2513         /* assume biggest type */
2514             global->code.globaladdr = code_globals_add(0);
2515             for (i = 1; i < type_sizeof[TYPE_VARIANT]; ++i)
2516                 code_globals_add(0);
2517             return true;
2518     default:
2519         /* refuse to create 'void' type or any other fancy business. */
2520         printf("Invalid type for global variable %s\n", global->name);
2521         return false;
2522     }
2523 }
2524
2525 bool ir_builder_generate(ir_builder *self, const char *filename)
2526 {
2527     size_t i;
2528
2529     code_init();
2530
2531     for (i = 0; i < self->globals_count; ++i)
2532     {
2533         if (!ir_builder_gen_global(self, self->globals[i])) {
2534             return false;
2535         }
2536     }
2537
2538     printf("writing '%s'...\n", filename);
2539     return code_write(filename);
2540 }
2541
2542 /***********************************************************************
2543  *IR DEBUG Dump functions...
2544  */
2545
2546 #define IND_BUFSZ 1024
2547
2548 const char *qc_opname(int op)
2549 {
2550     if (op < 0) return "<INVALID>";
2551     if (op < ( sizeof(asm_instr) / sizeof(asm_instr[0]) ))
2552         return asm_instr[op].m;
2553     switch (op) {
2554         case VINSTR_PHI:  return "PHI";
2555         case VINSTR_JUMP: return "JUMP";
2556         case VINSTR_COND: return "COND";
2557         default:          return "<UNK>";
2558     }
2559 }
2560
2561 void ir_builder_dump(ir_builder *b, int (*oprintf)(const char*, ...))
2562 {
2563         size_t i;
2564         char indent[IND_BUFSZ];
2565         indent[0] = '\t';
2566         indent[1] = 0;
2567
2568         oprintf("module %s\n", b->name);
2569         for (i = 0; i < b->globals_count; ++i)
2570         {
2571                 oprintf("global ");
2572                 if (b->globals[i]->isconst)
2573                         oprintf("%s = ", b->globals[i]->name);
2574                 ir_value_dump(b->globals[i], oprintf);
2575                 oprintf("\n");
2576         }
2577         for (i = 0; i < b->functions_count; ++i)
2578                 ir_function_dump(b->functions[i], indent, oprintf);
2579         oprintf("endmodule %s\n", b->name);
2580 }
2581
2582 void ir_function_dump(ir_function *f, char *ind,
2583                       int (*oprintf)(const char*, ...))
2584 {
2585         size_t i;
2586         if (f->builtin != 0) {
2587             oprintf("%sfunction %s = builtin %i\n", ind, f->name, -f->builtin);
2588             return;
2589         }
2590         oprintf("%sfunction %s\n", ind, f->name);
2591         strncat(ind, "\t", IND_BUFSZ);
2592         if (f->locals_count)
2593         {
2594                 oprintf("%s%i locals:\n", ind, (int)f->locals_count);
2595                 for (i = 0; i < f->locals_count; ++i) {
2596                         oprintf("%s\t", ind);
2597                         ir_value_dump(f->locals[i], oprintf);
2598                         oprintf("\n");
2599                 }
2600         }
2601         if (f->blocks_count)
2602         {
2603                 oprintf("%slife passes (check): %i\n", ind, (int)f->run_id);
2604                 for (i = 0; i < f->blocks_count; ++i) {
2605                     if (f->blocks[i]->run_id != f->run_id) {
2606                         oprintf("%slife pass check fail! %i != %i\n", ind, (int)f->blocks[i]->run_id, (int)f->run_id);
2607                     }
2608                         ir_block_dump(f->blocks[i], ind, oprintf);
2609                 }
2610
2611         }
2612         ind[strlen(ind)-1] = 0;
2613         oprintf("%sendfunction %s\n", ind, f->name);
2614 }
2615
2616 void ir_block_dump(ir_block* b, char *ind,
2617                    int (*oprintf)(const char*, ...))
2618 {
2619         size_t i;
2620         oprintf("%s:%s\n", ind, b->label);
2621         strncat(ind, "\t", IND_BUFSZ);
2622
2623         for (i = 0; i < b->instr_count; ++i)
2624                 ir_instr_dump(b->instr[i], ind, oprintf);
2625         ind[strlen(ind)-1] = 0;
2626 }
2627
2628 void dump_phi(ir_instr *in, char *ind,
2629               int (*oprintf)(const char*, ...))
2630 {
2631         size_t i;
2632         oprintf("%s <- phi ", in->_ops[0]->name);
2633         for (i = 0; i < in->phi_count; ++i)
2634         {
2635                 oprintf("([%s] : %s) ", in->phi[i].from->label,
2636                                         in->phi[i].value->name);
2637         }
2638         oprintf("\n");
2639 }
2640
2641 void ir_instr_dump(ir_instr *in, char *ind,
2642                        int (*oprintf)(const char*, ...))
2643 {
2644         size_t i;
2645         const char *comma = NULL;
2646
2647         oprintf("%s (%i) ", ind, (int)in->eid);
2648
2649         if (in->opcode == VINSTR_PHI) {
2650                 dump_phi(in, ind, oprintf);
2651                 return;
2652         }
2653
2654         strncat(ind, "\t", IND_BUFSZ);
2655
2656         if (in->_ops[0] && (in->_ops[1] || in->_ops[2])) {
2657                 ir_value_dump(in->_ops[0], oprintf);
2658                 if (in->_ops[1] || in->_ops[2])
2659                         oprintf(" <- ");
2660         }
2661         oprintf("%s\t", qc_opname(in->opcode));
2662         if (in->_ops[0] && !(in->_ops[1] || in->_ops[2])) {
2663                 ir_value_dump(in->_ops[0], oprintf);
2664                 comma = ",\t";
2665         }
2666         else
2667         {
2668                 for (i = 1; i != 3; ++i) {
2669                         if (in->_ops[i]) {
2670                                 if (comma)
2671                                         oprintf(comma);
2672                                 ir_value_dump(in->_ops[i], oprintf);
2673                                 comma = ",\t";
2674                         }
2675                 }
2676         }
2677         if (in->bops[0]) {
2678                 if (comma)
2679                         oprintf(comma);
2680                 oprintf("[%s]", in->bops[0]->label);
2681                 comma = ",\t";
2682         }
2683         if (in->bops[1])
2684                 oprintf("%s[%s]", comma, in->bops[1]->label);
2685         oprintf("\n");
2686         ind[strlen(ind)-1] = 0;
2687 }
2688
2689 void ir_value_dump(ir_value* v, int (*oprintf)(const char*, ...))
2690 {
2691         if (v->isconst) {
2692                 switch (v->vtype) {
2693                     default:
2694                         case TYPE_VOID:
2695                                 oprintf("(void)");
2696                                 break;
2697                         case TYPE_FLOAT:
2698                                 oprintf("%g", v->constval.vfloat);
2699                                 break;
2700                         case TYPE_VECTOR:
2701                                 oprintf("'%g %g %g'",
2702                                         v->constval.vvec.x,
2703                                         v->constval.vvec.y,
2704                                         v->constval.vvec.z);
2705                                 break;
2706                         case TYPE_ENTITY:
2707                                 oprintf("(entity)");
2708                                 break;
2709                         case TYPE_STRING:
2710                                 oprintf("\"%s\"", v->constval.vstring);
2711                                 break;
2712 #if 0
2713                         case TYPE_INTEGER:
2714                                 oprintf("%i", v->constval.vint);
2715                                 break;
2716 #endif
2717                         case TYPE_POINTER:
2718                                 oprintf("&%s",
2719                                         v->constval.vpointer->name);
2720                                 break;
2721                 }
2722         } else {
2723                 oprintf("%s", v->name);
2724         }
2725 }
2726
2727 void ir_value_dump_life(ir_value *self, int (*oprintf)(const char*,...))
2728 {
2729         size_t i;
2730         oprintf("Life of %s:\n", self->name);
2731         for (i = 0; i < self->life_count; ++i)
2732         {
2733                 oprintf(" + [%i, %i]\n", self->life[i].start, self->life[i].end);
2734         }
2735 }