]> git.xonotic.org Git - xonotic/gmqcc.git/blob - parser.c
7ae1341641700df4281bdbf8cfe09ade0307c540
[xonotic/gmqcc.git] / parser.c
1 #include <stdio.h>
2 #include <stdarg.h>
3
4 #include "gmqcc.h"
5 #include "lexer.h"
6
7 typedef struct {
8     lex_file *lex;
9     int      tok;
10
11     MEM_VECTOR_MAKE(ast_value*, globals);
12     MEM_VECTOR_MAKE(ast_function*, functions);
13
14     ast_function *function;
15     MEM_VECTOR_MAKE(ast_value*, locals);
16     size_t blocklocal;
17 } parser_t;
18
19 MEM_VEC_FUNCTIONS(parser_t, ast_value*, globals)
20 MEM_VEC_FUNCTIONS(parser_t, ast_value*, locals)
21 MEM_VEC_FUNCTIONS(parser_t, ast_function*, functions)
22
23 void parseerror(parser_t *parser, const char *fmt, ...)
24 {
25         va_list ap;
26
27     if (parser)
28             printf("error %s:%lu: ", parser->lex->tok->ctx.file, (unsigned long)parser->lex->tok->ctx.line);
29         else
30             printf("error: ");
31
32         va_start(ap, fmt);
33         vprintf(fmt, ap);
34         va_end(ap);
35
36         printf("\n");
37 }
38
39 bool parser_next(parser_t *parser)
40 {
41     /* lex_do kills the previous token */
42     parser->tok = lex_do(parser->lex);
43     if (parser->tok == TOKEN_EOF || parser->tok >= TOKEN_ERROR)
44         return false;
45     return true;
46 }
47
48 /* lift a token out of the parser so it's not destroyed by parser_next */
49 token *parser_lift(parser_t *parser)
50 {
51     token *tok = parser->lex->tok;
52     parser->lex->tok = NULL;
53     return tok;
54 }
55
56 #define parser_tokval(p) (p->lex->tok->value)
57 #define parser_token(p)  (p->lex->tok)
58 #define parser_ctx(p)    (p->lex->tok->ctx)
59
60 ast_value* parser_find_global(parser_t *parser, const char *name)
61 {
62     size_t i;
63     for (i = 0; i < parser->globals_count; ++i) {
64         if (!strcmp(parser->globals[i]->name, name))
65             return parser->globals[i];
66     }
67     return NULL;
68 }
69
70 ast_value* parser_find_local(parser_t *parser, const char *name, size_t upto)
71 {
72     size_t i;
73     for (i = parser->locals_count; i > upto;) {
74         --i;
75         if (!strcmp(parser->locals[i]->name, name))
76             return parser->locals[i];
77     }
78     return NULL;
79 }
80
81 ast_value* parser_find_var(parser_t *parser, const char *name)
82 {
83     ast_value *v;
84     v         = parser_find_local(parser, name, 0);
85     if (!v) v = parser_find_global(parser, name);
86     return v;
87 }
88
89 typedef struct {
90     MEM_VECTOR_MAKE(ast_value*, p);
91 } paramlist_t;
92 MEM_VEC_FUNCTIONS(paramlist_t, ast_value*, p)
93
94 static ast_value *parser_parse_type(parser_t *parser, bool *isfunc)
95 {
96     paramlist_t params;
97     ast_value *var;
98     lex_ctx   ctx = parser_ctx(parser);
99     int vtype = parser_token(parser)->constval.t;
100
101     MEM_VECTOR_INIT(&params, p);
102
103     *isfunc = false;
104
105     if (!parser_next(parser))
106         return NULL;
107
108     if (parser->tok == '(') {
109         *isfunc = true;
110         while (true) {
111             ast_value *param;
112             bool dummy;
113
114             if (!parser_next(parser)) {
115                 MEM_VECTOR_CLEAR(&params, p);
116                 return NULL;
117             }
118
119             if (parser->tok == ')')
120                 break;
121
122             param = parser_parse_type(parser, &dummy);
123             (void)dummy;
124
125             if (!param) {
126                 MEM_VECTOR_CLEAR(&params, p);
127                 return NULL;
128             }
129
130             if (!paramlist_t_p_add(&params, param)) {
131                 MEM_VECTOR_CLEAR(&params, p);
132                 parseerror(parser, "Out of memory while parsing typename");
133                 return NULL;
134             }
135
136             if (parser->tok == ',')
137                 continue;
138             if (parser->tok == ')')
139                 break;
140             MEM_VECTOR_CLEAR(&params, p);
141             parseerror(parser, "Unexpected token");
142             return NULL;
143         }
144         if (!parser_next(parser)) {
145             MEM_VECTOR_CLEAR(&params, p);
146             return NULL;
147         }
148     }
149
150     var = ast_value_new(ctx, "<unnamed>", vtype);
151     if (!var) {
152         MEM_VECTOR_CLEAR(&params, p);
153         return NULL;
154     }
155     MEM_VECTOR_MOVE(&params, p, var, params);
156     return var;
157 }
158
159 static bool parser_variable(parser_t *parser, bool global);
160 static bool parser_body_do(parser_t *parser, ast_block *block)
161 {
162     if (parser->tok == TOKEN_TYPENAME)
163     {
164         /* local variable */
165         if (!parser_variable(parser, false))
166             return false;
167         return true;
168     }
169     else if (parser->tok == '{')
170     {
171         /* a block */
172     }
173
174     parseerror(parser, "expected statement");
175     return false;
176 }
177
178 static ast_block* parser_parse_block(parser_t *parser)
179 {
180     size_t oldblocklocal;
181     ast_block *block = NULL;
182
183     oldblocklocal = parser->blocklocal;
184     parser->blocklocal = parser->locals_count;
185
186     if (!parser_next(parser)) { /* skip the '{' */
187         parseerror(parser, "expected function body");
188         goto cleanup;
189     }
190
191     block = ast_block_new(parser_ctx(parser));
192
193     while (parser->tok != TOKEN_EOF && parser->tok < TOKEN_ERROR)
194     {
195         if (parser->tok == '}')
196             break;
197
198         if (!parser_body_do(parser, block)) {
199             ast_block_delete(block);
200             block = NULL;
201             goto cleanup;
202         }
203     }
204
205     if (parser->tok != '}') {
206         ast_block_delete(block);
207         block = NULL;
208     } else {
209         (void)parser_next(parser);
210     }
211
212 cleanup:
213     parser->blocklocal = oldblocklocal;
214     return block;
215 }
216
217 static bool parser_variable(parser_t *parser, bool global)
218 {
219     bool isfunc = false;
220     ast_function *func = NULL;
221     lex_ctx ctx = parser_ctx(parser);
222     ast_value *var = parser_parse_type(parser, &isfunc);
223     if (!var)
224         return false;
225
226     if (parser->tok != TOKEN_IDENT) {
227         parseerror(parser, "expected variable name\n");
228         return false;
229     }
230
231     if (global && parser_find_global(parser, parser_tokval(parser))) {
232         ast_value_delete(var);
233         parseerror(parser, "global already exists: %s\n", parser_tokval(parser));
234         return false;
235     }
236
237     if (!global && parser_find_local(parser, parser_tokval(parser), parser->blocklocal)) {
238         ast_value_delete(var);
239         parseerror(parser, "local variable already exists: %s\n", parser_tokval(parser));
240         return false;
241     }
242
243     if (!ast_value_set_name(var, parser_tokval(parser))) {
244         parseerror(parser, "failed to set variable name\n");
245         ast_value_delete(var);
246         return false;
247     }
248
249     if (isfunc) {
250         /* a function was defined */
251         ast_value *fval;
252
253         /* turn var into a value of TYPE_FUNCTION, with the old var
254          * as return type
255          */
256         fval = ast_value_new(ctx, var->name, TYPE_FUNCTION);
257         func = ast_function_new(ctx, var->name, fval);
258         if (!fval || !func) {
259             ast_value_delete(var);
260             if (fval) ast_value_delete(fval);
261             if (func) ast_function_delete(func);
262             return false;
263         }
264
265         fval->expression.next = (ast_expression*)var;
266         MEM_VECTOR_MOVE(var, params, fval, params);
267
268         if (!parser_t_functions_add(parser, func)) {
269             ast_value_delete(var);
270             if (fval) ast_value_delete(fval);
271             if (func) ast_function_delete(func);
272             return false;
273         }
274
275         var = fval;
276     }
277
278     if ( ( global && !parser_t_globals_add(parser, var)) ||
279          (!global && !parser_t_locals_add(parser, var)) )
280     {
281         ast_value_delete(var);
282         return false;
283     }
284
285     if (!parser_next(parser)) {
286         ast_value_delete(var);
287         return false;
288     }
289
290     if (parser->tok == ';') {
291         if (!parser_next(parser))
292             return parser->tok == TOKEN_EOF;
293         return true;
294     }
295
296     if (parser->tok != '=') {
297         parseerror(parser, "expected '=' or ';'");
298         return false;
299     }
300
301     if (!parser_next(parser))
302         return false;
303
304     if (parser->tok == '#') {
305         if (!global) {
306             parseerror(parser, "cannot declare builtins within functions");
307             return false;
308         }
309         if (!isfunc || !func) {
310             parseerror(parser, "unexpected builtin number, '%s' is not a function", var->name);
311             return false;
312         }
313         if (!parser_next(parser)) {
314             parseerror(parser, "expected builtin number");
315             return false;
316         }
317         if (parser->tok != TOKEN_INTCONST) {
318             parseerror(parser, "builtin number must be an integer constant");
319             return false;
320         }
321         if (parser_token(parser)->constval.i <= 0) {
322             parseerror(parser, "builtin number must be positive integer greater than zero");
323             return false;
324         }
325
326         func->builtin = -parser_token(parser)->constval.i;
327     } else if (parser->tok == '{') {
328         /* function body */
329         ast_block *block;
330         ast_function *old = parser->function;
331
332         if (!global) {
333             parseerror(parser, "cannot declare functions within functions");
334             return false;
335         }
336
337         parser->function = func;
338         block = parser_parse_block(parser);
339         parser->function = old;
340
341         if (!block)
342             return false;
343
344         if (!ast_function_blocks_add(func, block)) {
345             ast_block_delete(block);
346             return false;
347         }
348         return true;
349     } else {
350         parseerror(parser, "TODO, const assignment");
351     }
352
353     if (!parser_next(parser))
354         return false;
355
356     if (parser->tok != ';') {
357         parseerror(parser, "expected semicolon");
358         return false;
359     }
360
361     (void)parser_next(parser);
362
363     return true;
364 }
365
366 static bool parser_do(parser_t *parser)
367 {
368     if (parser->tok == TOKEN_TYPENAME)
369     {
370         return parser_variable(parser, true);
371     }
372     else if (parser->tok == TOKEN_KEYWORD)
373     {
374         /* handle 'var' and 'const' */
375         return false;
376     }
377     else if (parser->tok == '.')
378     {
379         /* entity-member declaration */
380         return false;
381     }
382     else
383     {
384         parseerror(parser, "unexpected token: %s", parser->lex->tok->value);
385         return false;
386     }
387     return true;
388 }
389
390 bool parser_compile(const char *filename)
391 {
392     size_t i;
393     parser_t *parser;
394     ir_builder *ir;
395
396     parser = (parser_t*)mem_a(sizeof(parser_t));
397     if (!parser)
398         return false;
399
400     memset(parser, 0, sizeof(parser));
401
402     MEM_VECTOR_INIT(parser, globals);
403     MEM_VECTOR_INIT(parser, locals);
404     parser->lex = lex_open(filename);
405
406     if (!parser->lex) {
407         printf("failed to open file \"%s\"\n", filename);
408         return false;
409     }
410
411     /* initial lexer/parser state */
412     parser->lex->flags.noops = true;
413
414     if (parser_next(parser))
415     {
416         while (parser->tok != TOKEN_EOF && parser->tok < TOKEN_ERROR)
417         {
418             if (!parser_do(parser)) {
419                 if (parser->tok == TOKEN_EOF)
420                     parseerror(parser, "unexpected eof");
421                 else
422                     parseerror(parser, "parse error\n");
423                 lex_close(parser->lex);
424                 mem_d(parser);
425                 return false;
426             }
427         }
428     }
429
430     lex_close(parser->lex);
431
432     ir = ir_builder_new("gmqcc_out");
433     if (!ir) {
434         printf("failed to allocate builder\n");
435         goto cleanup;
436     }
437
438     for (i = 0; i < parser->globals_count; ++i) {
439         if (!ast_global_codegen(parser->globals[i], ir)) {
440             printf("failed to generate global %s\n", parser->globals[i]->name);
441         }
442     }
443     for (i = 0; i < parser->functions_count; ++i) {
444         if (!ast_function_codegen(parser->functions[i], ir)) {
445             printf("failed to generate function %s\n", parser->functions[i]->name);
446         }
447         if (!ir_function_finalize(parser->functions[i]->ir_func)) {
448             printf("failed to finalize function %s\n", parser->functions[i]->name);
449         }
450     }
451
452     ir_builder_dump(ir, printf);
453
454 cleanup:
455     for (i = 0; i < parser->globals_count; ++i) {
456         ast_value_delete(parser->globals[i]);
457     }
458     MEM_VECTOR_CLEAR(parser, globals);
459
460     mem_d(parser);
461     return true;
462 }