]> git.xonotic.org Git - xonotic/gmqcc.git/blob - gmqcc.h
Space indentation for ast->ir part
[xonotic/gmqcc.git] / gmqcc.h
1 /*
2  * Copyright (C) 2012 
3  *     Dale Weiler
4  *
5  * Permission is hereby granted, free of charge, to any person obtaining a copy of
6  * this software and associated documentation files (the "Software"), to deal in
7  * the Software without restriction, including without limitation the rights to
8  * use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies
9  * of the Software, and to permit persons to whom the Software is furnished to do
10  * so, subject to the following conditions:
11  *
12  * The above copyright notice and this permission notice shall be included in all
13  * copies or substantial portions of the Software.
14  *
15  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
16  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
17  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
18  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
19  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
20  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
21  * SOFTWARE.
22  */
23 #ifndef GMQCC_HDR
24 #define GMQCC_HDR
25 #include <limits.h>
26 #include <stdlib.h>
27 #include <string.h>
28 #include <stdio.h>
29 #include <ctype.h>
30 /*
31  * stdint.h and inttypes.h -less subset
32  * for systems that don't have it, which we must
33  * assume is all systems. (int8_t not required)
34  */
35 #if   CHAR_MIN  == -128
36     typedef unsigned char  uint8_t; /* same as below */
37 #elif SCHAR_MIN == -128
38     typedef unsigned char  uint8_t; /* same as above */
39 #endif
40 #if   SHRT_MAX  == 0x7FFF
41     typedef short          int16_t;
42     typedef unsigned short uint16_t;
43 #elif INT_MAX   == 0x7FFF
44     typedef int            int16_t;
45     typedef unsigned int   uint16_t;
46 #endif
47 #if   INT_MAX   == 0x7FFFFFFF 
48     typedef int            int32_t;
49     typedef unsigned int   uint32_t;
50 #elif LONG_MAX  == 0x7FFFFFFF
51     typedef long           int32_t;
52     typedef unsigned long  uint32_t;
53 #endif
54 #ifdef _LP64 /* long pointer == 64 */
55     typedef unsigned long  uintptr_t;
56     typedef long           intptr_t;
57 #else
58     typedef unsigned int   uintptr_t;
59     typedef int            intptr_t;
60 #endif 
61 /* Ensure type sizes are correct: */
62 typedef char uint8_size_is_correct  [sizeof(uint8_t)  == 1?1:-1];
63 typedef char uint16_size_if_correct [sizeof(uint16_t) == 2?1:-1];
64 typedef char uint32_size_is_correct [sizeof(uint32_t) == 4?1:-1];
65 typedef char int8_size_is_correct   [sizeof(int8_t)   == 1?1:-1];
66 typedef char int16_size_if_correct  [sizeof(int16_t)  == 2?1:-1];
67 typedef char int32_size_is_correct  [sizeof(int32_t)  == 4?1:-1];
68 /* intptr_t / uintptr_t correct size check */
69 typedef char uintptr_size_is_correct[sizeof(intptr_t) == sizeof(int*)?1:-1];
70 typedef char intptr_size_is_correct [sizeof(uintptr_t)== sizeof(int*)?1:-1];
71
72 //===================================================================
73 //============================ lex.c ================================
74 //===================================================================
75 struct lex_file {
76     FILE *file;        /* file handler */
77     char *name;        /* name of file */
78     char  peek  [5];  
79     char  lastok[8192];
80     
81     int   last;    /* last token                   */
82     int   current; /* current token                */
83     int   length;  /* bytes left to parse          */
84     int   size;    /* never changes (size of file) */
85     int   line;    /* what line are we on?         */
86 };
87
88 /*
89  * It's important that this table never exceed 32 keywords, the ascii
90  * table starts at 33 (and we don't want conflicts)
91  */
92 enum {
93     TOKEN_DO       ,
94     TOKEN_ELSE     ,
95     TOKEN_IF       ,
96     TOKEN_WHILE    ,
97     TOKEN_BREAK    ,
98     TOKEN_CONTINUE ,
99     TOKEN_RETURN   ,
100     TOKEN_GOTO     ,
101     TOKEN_FOR      ,   // extension
102     TOKEN_TYPEDEF  ,   // extension
103
104     // ensure the token types are out of the
105     // bounds of anyothers that may conflict.
106     TOKEN_FLOAT    = 110,
107     TOKEN_VECTOR        ,
108     TOKEN_STRING        ,
109     TOKEN_ENTITY        ,
110     TOKEN_VOID
111 };
112
113 /*
114  * Lexer state constants, these are numbers for where exactly in
115  * the lexing the lexer is at. Or where it decided to stop if a lexer
116  * error occurs.  These numbers must be > where the ascii-table ends
117  * and > the last type token which is TOKEN_VOID
118  */
119 enum {
120     LEX_COMMENT = 1128, 
121     LEX_CHRLIT        ,
122     LEX_STRLIT        ,
123     LEX_IDENT
124 };
125
126 int              lex_token  (struct lex_file *);
127 void             lex_reset  (struct lex_file *);
128 void             lex_close  (struct lex_file *);
129 struct lex_file *lex_include(struct lex_file *, char *);
130 struct lex_file *lex_open   (FILE *);
131
132 //===================================================================
133 //========================== error.c ================================
134 //===================================================================
135 #define ERROR_LEX      (SHRT_MAX+0)
136 #define ERROR_PARSE    (SHRT_MAX+1)
137 #define ERROR_INTERNAL (SHRT_MAX+2)
138 #define ERROR_COMPILER (SHRT_MAX+3)
139 #define ERROR_PREPRO   (SHRT_MAX+4)
140 int error(struct lex_file *, int, const char *, ...);
141
142 //===================================================================
143 //========================== parse.c ================================
144 //===================================================================
145 int parse_gen(struct lex_file *);
146
147 //===================================================================
148 //========================== typedef.c ==============================
149 //===================================================================
150 typedef struct typedef_node_t {
151     char      *name;
152 } typedef_node;
153
154 void          typedef_init();
155 void          typedef_clear();
156 typedef_node *typedef_find(const char *);
157 int           typedef_add (struct lex_file *file, const char *, const char *);
158
159
160 //===================================================================
161 //=========================== util.c ================================
162 //===================================================================
163 void *util_memory_a  (unsigned int, unsigned int, const char *);
164 void  util_memory_d  (void       *, unsigned int, const char *);
165 void  util_meminfo   ();
166
167 char *util_strdup    (const char *);
168 char *util_strrq     (char *);
169 char *util_strrnl    (char *);
170 void  util_debug     (const char *, const char *, ...);
171 int   util_getline   (char **, size_t *, FILE *);
172 void  util_endianswap(void *, int, int);
173
174 uint32_t util_crc32(const char *, int, register const short); 
175
176 #ifdef NOTRACK
177 #    define mem_a(x) malloc(x)
178 #    define mem_d(x) free  (x)
179 #else
180 #    define mem_a(x) util_memory_a((x), __LINE__, __FILE__)
181 #    define mem_d(x) util_memory_d((x), __LINE__, __FILE__)
182 #endif
183
184 #define VECTOR_MAKE(T,N)                                                 \
185     T*     N##_data      = NULL;                                         \
186     long   N##_elements  = 0;                                            \
187     long   N##_allocated = 0;                                            \
188     int    N##_add(T element) {                                          \
189         if (N##_elements == N##_allocated) {                             \
190             if (N##_allocated == 0) {                                    \
191                 N##_allocated = 12;                                      \
192             } else {                                                     \
193                 N##_allocated *= 2;                                      \
194             }                                                            \
195             void *temp = mem_a(N##_allocated * sizeof(T));               \
196             if  (!temp) {                                                \
197                 mem_d(temp);                                             \
198                 return -1;                                               \
199             }                                                            \
200             memcpy(temp, N##_data, (N##_elements * sizeof(T)));          \
201             mem_d(N##_data);                                             \
202             N##_data = (T*)temp;                                         \
203         }                                                                \
204         N##_data[N##_elements] = element;                                \
205         return   N##_elements++;                                         \
206     }
207
208 //===================================================================
209 //=========================== code.c ================================
210 //===================================================================
211 enum {
212     TYPE_VOID     ,
213     TYPE_STRING   ,
214     TYPE_FLOAT    ,
215     TYPE_VECTOR   ,
216     TYPE_ENTITY   ,
217     TYPE_FIELD    ,
218     TYPE_FUNCTION ,
219     TYPE_POINTER
220 };
221
222 /*
223  * Each paramater incerements by 3 since vector types hold
224  * 3 components (x,y,z).
225  */
226 #define OFS_NULL      0
227 #define OFS_RETURN    1
228 #define OFS_PARM0     (OFS_RETURN+3)
229 #define OFS_PARM1     (OFS_PARM0 +3)
230 #define OFS_PARM2     (OFS_PARM1 +3)
231 #define OFS_PARM3     (OFS_PARM2 +3)
232 #define OFS_PARM4     (OFS_PARM3 +3)
233 #define OFS_PARM5     (OFS_PARM4 +3)
234 #define OFS_PARM6     (OFS_PARM5 +3)
235 #define OFS_PARM7     (OFS_PARM6 +3)
236
237 typedef struct {
238     uint16_t opcode;
239     
240     /* operand 1 */
241     union {
242         int16_t  s1; /* signed   */
243         uint16_t u1; /* unsigned */
244     };
245     /* operand 2 */
246     union {
247         int16_t  s2; /* signed   */
248         uint16_t u2; /* unsigned */
249     };
250     /* operand 3 */
251     union {
252         int16_t  s3; /* signed   */
253         uint16_t u3; /* unsigned */
254     };
255     
256     /*
257      * This is the same as the structure in darkplaces
258      * {
259      *     unsigned short op;
260      *     short          a,b,c;
261      * }
262      * But this one is more sane to work with, and the
263      * type sizes are guranteed.
264      */
265 } prog_section_statement;
266
267 typedef struct {
268     /* The types:
269      * 0 = ev_void
270      * 1 = ev_string
271      * 2 = ev_float
272      * 3 = ev_vector
273      * 4 = ev_entity
274      * 5 = ev_field
275      * 6 = ev_function
276      * 7 = ev_pointer -- engine only
277      * 8 = ev_bad     -- engine only
278      */
279     uint16_t type;
280     uint16_t offset;
281     uint32_t name;
282 } prog_section_both;
283 typedef prog_section_both prog_section_def;
284 typedef prog_section_both prog_section_field;
285
286 typedef struct {
287     int32_t   entry;      /* in statement table for instructions  */
288     uint32_t  firstlocal; /* First local in local table           */
289     uint32_t  locals;     /* Total ints of params + locals        */
290     uint32_t  profile;    /* Always zero (engine uses this)       */
291     uint32_t  name;       /* name of function in string table     */
292     uint32_t  file;       /* file of the source file              */
293     uint32_t  nargs;      /* number of arguments                  */
294     uint8_t   argsize[8]; /* size of arguments (keep 8 always?)   */
295 } prog_section_function;
296
297 /* 
298  * Instructions 
299  * These are the external instructions supported by the interperter
300  * this is what things compile to (from the C code).
301  */
302 enum {
303     INSTR_DONE,
304     INSTR_MUL_F,
305     INSTR_MUL_V,
306     INSTR_MUL_FV,
307     INSTR_MUL_VF,
308     INSTR_DIV_F,
309     INSTR_ADD_F,
310     INSTR_ADD_V,
311     INSTR_SUB_F,
312     INSTR_SUB_V,
313     INSTR_EQ_F,
314     INSTR_EQ_V,
315     INSTR_EQ_S,
316     INSTR_EQ_E,
317     INSTR_EQ_FNC,
318     INSTR_NE_F,
319     INSTR_NE_V,
320     INSTR_NE_S,
321     INSTR_NE_E,
322     INSTR_NE_FNC,
323     INSTR_LE,
324     INSTR_GE,
325     INSTR_LT,
326     INSTR_GT,
327     INSTR_LOAD_F,
328     INSTR_LOAD_V,
329     INSTR_LOAD_S,
330     INSTR_LOAD_ENT,
331     INSTR_LOAD_FLD,
332     INSTR_LOAD_FNC,
333     INSTR_ADDRESS,
334     INSTR_STORE_F,
335     INSTR_STORE_V,
336     INSTR_STORE_S,
337     INSTR_STORE_ENT,
338     INSTR_STORE_FLD,
339     INSTR_STORE_FNC,
340     INSTR_STOREP_F,
341     INSTR_STOREP_V,
342     INSTR_STOREP_S,
343     INSTR_STOREP_ENT,
344     INSTR_STOREP_FLD,
345     INSTR_STOREP_FNC,
346     INSTR_RETURN,
347     INSTR_NOT_F,
348     INSTR_NOT_V,
349     INSTR_NOT_S,
350     INSTR_NOT_ENT,
351     INSTR_NOT_FNC,
352     INSTR_IF,
353     INSTR_IFNOT,
354     INSTR_CALL0,
355     INSTR_CALL1,
356     INSTR_CALL2,
357     INSTR_CALL3,
358     INSTR_CALL4,
359     INSTR_CALL5,
360     INSTR_CALL6,
361     INSTR_CALL7,
362     INSTR_CALL8,
363     INSTR_STATE,
364     INSTR_GOTO,
365     INSTR_AND,
366     INSTR_OR,
367     INSTR_BITAND,
368     INSTR_BITOR
369 };
370
371 /*
372  * The symbols below are created by the following
373  * expanded macros:
374  * 
375  * VECTOR_MAKE(prog_section_statement, code_statements);
376  * VECTOR_MAKE(prog_section_def,       code_defs      );
377  * VECTOR_MAKE(prog_section_field,     code_fields    );
378  * VECTOR_MAKE(prog_section_function,  code_functions );
379  * VECTOR_MAKE(int,                    code_globals   );
380  * VECTOR_MAKE(char,                   code_chars     );
381  */
382 int         code_statements_add(prog_section_statement);
383 int         code_defs_add      (prog_section_def);
384 int         code_fields_add    (prog_section_field);
385 int         code_functions_add (prog_section_function);
386 int         code_globals_add   (int);
387 int         code_chars_add     (char);
388 int         code_strings_add   (const char *); /* function wrapping code_chars_add */
389 extern long code_statements_elements;
390 extern long code_chars_elements;
391 extern long code_globals_elements;
392 extern long code_functions_elements;
393 extern long code_fields_elements;
394 extern long code_defs_elements;
395
396 /*
397  * code_write -- writes out the compiled file
398  * code_init  -- prepares the code file
399  */
400 void code_write ();
401 void code_init  ();
402
403 //===================================================================
404 //========================= assembler.c =============================
405 //===================================================================
406 static const struct {
407     const char  *m; /* menomic     */
408     const size_t o; /* operands    */ 
409     const size_t l; /* menomic len */
410 } const asm_instr[] = {
411     [INSTR_DONE]       = { "DONE"      , 1, 4 },
412     [INSTR_MUL_F]      = { "MUL_F"     , 3, 5 },
413     [INSTR_MUL_V]      = { "MUL_V"     , 3, 5 },
414     [INSTR_MUL_FV]     = { "MUL_FV"    , 3, 6 },
415     [INSTR_MUL_VF]     = { "MUL_VF"    , 3, 6 },
416     [INSTR_DIV_F]      = { "DIV"       , 0, 3 },
417     [INSTR_ADD_F]      = { "ADD_F"     , 3, 5 },
418     [INSTR_ADD_V]      = { "ADD_V"     , 3, 5 },
419     [INSTR_SUB_F]      = { "SUB_F"     , 3, 5 },
420     [INSTR_SUB_V]      = { "DUB_V"     , 3, 5 },
421     [INSTR_EQ_F]       = { "EQ_F"      , 0, 4 },
422     [INSTR_EQ_V]       = { "EQ_V"      , 0, 4 },
423     [INSTR_EQ_S]       = { "EQ_S"      , 0, 4 },
424     [INSTR_EQ_E]       = { "EQ_E"      , 0, 4 },
425     [INSTR_EQ_FNC]     = { "ES_FNC"    , 0, 6 },
426     [INSTR_NE_F]       = { "NE_F"      , 0, 4 },
427     [INSTR_NE_V]       = { "NE_V"      , 0, 4 },
428     [INSTR_NE_S]       = { "NE_S"      , 0, 4 },
429     [INSTR_NE_E]       = { "NE_E"      , 0, 4 },
430     [INSTR_NE_FNC]     = { "NE_FNC"    , 0, 6 },
431     [INSTR_LE]         = { "LE"        , 0, 2 },
432     [INSTR_GE]         = { "GE"        , 0, 2 },
433     [INSTR_LT]         = { "LT"        , 0, 2 },
434     [INSTR_GT]         = { "GT"        , 0, 2 },
435     [INSTR_LOAD_F]     = { "FIELD_F"   , 0, 7 },
436     [INSTR_LOAD_V]     = { "FIELD_V"   , 0, 7 },
437     [INSTR_LOAD_S]     = { "FIELD_S"   , 0, 7 },
438     [INSTR_LOAD_ENT]   = { "FIELD_ENT" , 0, 9 },
439     [INSTR_LOAD_FLD]   = { "FIELD_FLD" , 0, 9 },
440     [INSTR_LOAD_FNC]   = { "FIELD_FNC" , 0, 9 },
441     [INSTR_ADDRESS]    = { "ADDRESS"   , 0, 7 },
442     [INSTR_STORE_F]    = { "STORE_F"   , 0, 7 },
443     [INSTR_STORE_V]    = { "STORE_V"   , 0, 7 },
444     [INSTR_STORE_S]    = { "STORE_S"   , 0, 7 },
445     [INSTR_STORE_ENT]  = { "STORE_ENT" , 0, 9 },
446     [INSTR_STORE_FLD]  = { "STORE_FLD" , 0, 9 },
447     [INSTR_STORE_FNC]  = { "STORE_FNC" , 0, 9 },
448     [INSTR_STOREP_F]   = { "STOREP_F"  , 0, 8 },
449     [INSTR_STOREP_V]   = { "STOREP_V"  , 0, 8 },
450     [INSTR_STOREP_S]   = { "STOREP_S"  , 0, 8 },
451     [INSTR_STOREP_ENT] = { "STOREP_ENT", 0, 10},
452     [INSTR_STOREP_FLD] = { "STOREP_FLD", 0, 10},
453     [INSTR_STOREP_FNC] = { "STOREP_FNC", 0, 10},
454     [INSTR_RETURN]     = { "RETURN"    , 0, 6 },
455     [INSTR_NOT_F]      = { "NOT_F"     , 0, 5 },
456     [INSTR_NOT_V]      = { "NOT_V"     , 0, 5 },
457     [INSTR_NOT_S]      = { "NOT_S"     , 0, 5 },
458     [INSTR_NOT_ENT]    = { "NOT_ENT"   , 0, 7 },
459     [INSTR_NOT_FNC]    = { "NOT_FNC"   , 0, 7 },
460     [INSTR_IF]         = { "IF"        , 0, 2 },
461     [INSTR_IFNOT]      = { "IFNOT"     , 0, 5 },
462     [INSTR_CALL0]      = { "CALL0"     , 0, 5 },
463     [INSTR_CALL1]      = { "CALL1"     , 0, 5 },
464     [INSTR_CALL2]      = { "CALL2"     , 0, 5 },
465     [INSTR_CALL3]      = { "CALL3"     , 0, 5 },
466     [INSTR_CALL4]      = { "CALL4"     , 0, 5 },
467     [INSTR_CALL5]      = { "CALL5"     , 0, 5 },
468     [INSTR_CALL6]      = { "CALL6"     , 0, 5 },
469     [INSTR_CALL7]      = { "CALL7"     , 0, 5 },
470     [INSTR_CALL8]      = { "CALL8"     , 0, 5 },
471     [INSTR_STATE]      = { "STATE"     , 0, 5 },
472     [INSTR_GOTO]       = { "GOTO"      , 0, 4 },
473     [INSTR_AND]        = { "AND"       , 0, 3 },
474     [INSTR_OR]         = { "OR"        , 0, 2 },
475     [INSTR_BITAND]     = { "BITAND"    , 0, 6 },
476     [INSTR_BITOR]      = { "BITOR"     , 0, 5 }
477 };
478
479 void asm_init (const char *, FILE **);
480 void asm_close(FILE *);
481 void asm_parse(FILE *);
482 //======================================================================
483 //============================= main.c =================================
484 //======================================================================
485 enum {
486     COMPILER_QCC,     /* circa  QuakeC */
487     COMPILER_FTEQCC,  /* fteqcc QuakeC */
488     COMPILER_QCCX,    /* qccx   QuakeC */
489     COMPILER_GMQCC    /* this   QuakeC */
490 };
491 extern int opts_debug;
492 extern int opts_memchk;
493 extern int opts_darkplaces_stringtablebug;
494 extern int opts_omit_nullcode;
495 #endif