]> git.xonotic.org Git - xonotic/gmqcc.git/blob - gmqcc.h
Less flexible more economical utf8 decoder.
[xonotic/gmqcc.git] / gmqcc.h
1 /*
2  * Copyright (C) 2012, 2013
3  *     Dale Weiler
4  *     Wolfgang Bumiller
5  *
6  * Permission is hereby granted, free of charge, to any person obtaining a copy of
7  * this software and associated documentation files (the "Software"), to deal in
8  * the Software without restriction, including without limitation the rights to
9  * use, copy, modify, merge, publish, distribute, sublicense, and/or sell copies
10  * of the Software, and to permit persons to whom the Software is furnished to do
11  * so, subject to the following conditions:
12  *
13  * The above copyright notice and this permission notice shall be included in all
14  * copies or substantial portions of the Software.
15  *
16  * THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
17  * IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
18  * FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
19  * AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
20  * LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
21  * OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN THE
22  * SOFTWARE.
23  */
24 #ifndef GMQCC_HDR
25 #define GMQCC_HDR
26 #include <stdarg.h>
27 #include <stdio.h> /* TODO: remove this */
28
29 /*
30  * Disable some over protective warnings in visual studio because fixing them is a waste
31  * of my time.
32  */
33 #ifdef _MSC_VER
34 #   pragma warning(disable : 4244 ) /* conversion from 'int' to 'float', possible loss of data */
35 #endif /*! _MSC_VER */
36
37 #define GMQCC_VERSION_MAJOR 0
38 #define GMQCC_VERSION_MINOR 4
39 #define GMQCC_VERSION_PATCH 0
40 #define GMQCC_VERSION_BUILD(J,N,P) (((J)<<16)|((N)<<8)|(P))
41 #define GMQCC_VERSION \
42     GMQCC_VERSION_BUILD(GMQCC_VERSION_MAJOR, GMQCC_VERSION_MINOR, GMQCC_VERSION_PATCH)
43 /* Undefine the following on a release-tag: */
44 #define GMQCC_VERSION_TYPE_DEVEL
45
46 /* Full version string in case we need it */
47 #ifdef GMQCC_VERSION_TYPE_DEVEL
48 #    ifdef GMQCC_GITINFO
49 #        define GMQCC_DEV_VERSION_STRING "git build: " GMQCC_GITINFO "\n"
50 #    elif defined(GMQCC_VERSION_TYPE_DEVEL)
51 #        define GMQCC_DEV_VERSION_STRING "development build\n"
52 #    else
53 #        define GMQCC_DEV_VERSION_STRING
54 #    endif /*! GMQCC_GITINGO */
55 #else
56 #    define GMQCC_DEV_VERSION_STRING
57 #endif
58
59 #define GMQCC_STRINGIFY(x) #x
60 #define GMQCC_IND_STRING(x) GMQCC_STRINGIFY(x)
61 #define GMQCC_FULL_VERSION_STRING \
62 "GMQCC " \
63 GMQCC_IND_STRING(GMQCC_VERSION_MAJOR) "." \
64 GMQCC_IND_STRING(GMQCC_VERSION_MINOR) "." \
65 GMQCC_IND_STRING(GMQCC_VERSION_PATCH) \
66 " Built " __DATE__ " " __TIME__ \
67 "\n" GMQCC_DEV_VERSION_STRING
68
69 /*
70  * We cannot rely on C99 at all, since compilers like MSVC
71  * simply don't support it.  We define our own boolean type
72  * as a result (since we cannot include <stdbool.h>). For
73  * compilers that are in 1999 mode (C99 compliant) we can use
74  * the language keyword _Bool which can allow for better code
75  * on GCC and GCC-like compilers, opposed to `int`.
76  */
77 #ifndef __cplusplus
78 #   ifdef  false
79 #       undef  false
80 #   endif /*! false */
81 #   ifdef  true
82 #       undef true
83 #   endif /*! true  */
84 #   define false (unsigned)(0)
85 #   define true  (unsigned)(1)
86 #   ifdef __STDC_VERSION__
87 #       if __STDC_VERSION__ < 199901L && __GNUC__ < 3
88             typedef int  bool;
89 #       else
90             typedef _Bool bool;
91 #       endif /*! __STDC_VERSION__ < 199901L && __GNUC__ < 3 */
92 #   else
93         typedef int bool;
94 #   endif /*! __STDC_VERSION__ */
95 #endif /*! __cplusplus      */
96
97 /*
98  * Of some functions which are generated we want to make sure
99  * that the result isn't ignored. To find such function calls,
100  * we use this macro.
101  */
102 #if defined(__GNUC__) || defined(__CLANG__)
103 #   define GMQCC_WARN __attribute__((warn_unused_result))
104 #   define GMQCC_USED __attribute__((used))
105 #else
106 #   define GMQCC_WARN
107 #   define GMQCC_USED
108 #endif /*! defined(__GNUC__) || defined (__CLANG__) */
109
110 /*
111  * Inline is not supported in < C90, however some compilers
112  * like gcc and clang might have an inline attribute we can
113  * use if present.
114  */
115 #ifdef __STDC_VERSION__
116 #    if __STDC_VERSION__ < 199901L
117 #       if defined(__GNUC__) || defined (__CLANG__)
118 #           if __GNUC__ < 2
119 #               define GMQCC_INLINE
120 #           else
121 #               define GMQCC_INLINE __attribute__ ((always_inline))
122 #           endif /*! __GNUC__ < 2 */
123 #       else
124 #           define GMQCC_INLINE
125 #       endif /*! defined(__GNUC__) || defined (__CLANG__) */
126 #    else
127 #       define GMQCC_INLINE inline
128 #    endif /*! __STDC_VERSION < 199901L */
129 /*
130  * Visual studio has __forcinline we can use.  So lets use that
131  * I suspect it also has just __inline of some sort, but our use
132  * of inline is correct (not guessed), WE WANT IT TO BE INLINE
133  */
134 #elif defined(_MSC_VER)
135 #    define GMQCC_INLINE __forceinline
136 #else
137 #    define GMQCC_INLINE
138 #endif /*! __STDC_VERSION__ */
139
140 /*
141  * noreturn is present in GCC and clang
142  * it's required for _ast_node_destory otherwise -Wmissing-noreturn
143  * in clang complains about there being no return since abort() is
144  * called.
145  */
146 #if (defined(__GNUC__) && __GNUC__ >= 2) || defined(__CLANG__)
147 #    define GMQCC_NORETURN __attribute__ ((noreturn))
148 #else
149 #    define GMQCC_NORETURN
150 #endif /*! (defined(__GNUC__) && __GNUC__ >= 2) || defined (__CLANG__) */
151
152 #if (defined(__GNUC__)) || defined(__CLANG__)
153 #   define GMQCC_LIKELY(X)   __builtin_expect((X), 1)
154 #   define GMQCC_UNLIKELY(X) __builtin_expect((X), 0)
155 #else
156 #   define GMQCC_LIKELY(X)   (X)
157 #   define GMQCC_UNLIKELY(X) (X)
158 #endif
159
160 #define GMQCC_ARRAY_COUNT(X) (sizeof(X) / sizeof((X)[0]))
161
162 #ifndef _MSC_VER
163 #   include <stdint.h>
164 #else
165     typedef unsigned __int8  uint8_t;
166     typedef unsigned __int16 uint16_t;
167     typedef unsigned __int32 uint32_t;
168     typedef unsigned __int64 uint64_t;
169
170     typedef __int16          int16_t;
171     typedef __int32          int32_t;
172     typedef __int64          int64_t;
173 #endif /*! _MSC_VER */
174
175 /*
176  * Very roboust way at determining endianess at compile time: this handles
177  * almost every possible situation.  Otherwise a runtime check has to be
178  * performed.
179  */
180 #define GMQCC_BYTE_ORDER_LITTLE 1234
181 #define GMQCC_BYTE_ORDER_BIG    4321
182
183 #if defined (__GNUC__) || defined (__GNU_LIBRARY__)
184 #   if defined (__FreeBSD__) || defined (__OpenBSD__)
185 #       include <sys/endian.h>
186 #   elif defined (BSD) && (BSD >= 199103) || defined (__DJGPP__) || defined (__CYGWIN32__)
187 #       include <machine/endian.h>
188 #   elif defined (__APPLE__)
189 #       if defined (__BIG_ENDIAN__) && !defined(BIG_ENDIAN)
190 #           define BIG_ENDIAN
191 #       elif defined (__LITTLE_ENDIAN__) && !defined (LITTLE_ENDIAN)
192 #           define LITTLE_ENDIAN
193 #       endif /*! defined (__BIG_ENDIAN__) && !defined(BIG_ENDIAN) */
194 #   elif !defined (__MINGW32__)
195 #       include <endian.h>
196 #       if !defined (__BEOS__)
197 #           include <byteswap.h>
198 #       endif /*! !definde (__BEOS__) */
199 #   endif /*! defined (__FreeBSD__) || defined (__OpenBSD__) */
200 #endif /*! defined (__GNUC__) || defined (__GNU_LIBRARY__) */
201 #if !defined(PLATFORM_BYTE_ORDER)
202 #   if defined (LITTLE_ENDIAN) || defined (BIG_ENDIAN)
203 #       if defined (LITTLE_ENDIAN) && !defined(BIG_ENDIAN)
204 #           define PLATFORM_BYTE_ORDER GMQCC_BYTE_ORDER_LITTLE
205 #       elif !defined (LITTLE_ENDIAN) && defined (BIG_ENDIAN)
206 #           define PLATFORM_BYTE_ORDER GMQCC_BYTE_ORDER_BIG
207 #       elif defined (BYTE_ORDER) && (BYTE_ORDER == LITTLE_ENDIAN)
208 #           define PLATFORM_BYTE_ORDER GMQCC_BYTE_ORDER_LITTLE
209 #       elif defined (BYTE_ORDER) && (BYTE_ORDER == BIG_ENDIAN)
210 #           define PLATFORM_BYTE_ORDER GMQCC_BYTE_ORDER_BIG
211 #       endif /*! defined (LITTLE_ENDIAN) && !defined(BIG_ENDIAN) */
212 #   elif defined (_LITTLE_ENDIAN) || defined (_BIG_ENDIAN)
213 #       if defined (_LITTLE_ENDIAN) && !defined(_BIG_ENDIAN)
214 #           define PLATFORM_BYTE_ORDER GMQCC_BYTE_ORDER_LITTLE
215 #       elif !defined (_LITTLE_ENDIAN) && defined (_BIG_ENDIAN)
216 #           define PLATFORM_BYTE_ORDER GMQCC_BYTE_ORDER_BIG
217 #       elif defined (_BYTE_ORDER) && (_BYTE_ORDER == _LITTLE_ENDIAN)
218 #           define PLATFORM_BYTE_ORDER GMQCC_BYTE_ORDER_LITTLE
219 #       elif defined (_BYTE_ORDER) && (_BYTE_ORDER == _BIG_ENDIAN)
220 #           define PLATFORM_BYTE_ORDER GMQCC_BYTE_ORDER_BIG
221 #       endif /*! defined (_LITTLE_ENDIAN) && !defined(_BIG_ENDIAN) */
222 #   elif defined (__LITTLE_ENDIAN__) || defined (__BIG_ENDIAN__)
223 #       if defined (__LITTLE_ENDIAN__) && !defined (__BIG_ENDIAN__)
224 #           define PLATFORM_BYTE_ORDER GMQCC_BYTE_ORDER_LITTLE
225 #       elif !defined (__LITTLE_ENDIAN__) && defined (__BIG_ENDIAN__)
226 #           define PLATFORM_BYTE_ORDER GMQCC_BYTE_ORDER_BIG
227 #       elif defined (__BYTE_ORDER__) && (__BYTE_ORDER__ == __LITTLE_ENDIAN__)
228 #           define PLATFORM_BYTE_ORDER GMQCC_BYTE_ORDER_LITTLE
229 #       elif defined (__BYTE_ORDER__) && (__BYTE_ORDER__ == __BIG_ENDIAN__)
230 #           define PLATFORM_BYTE_ORDER GMQCC_BYTE_ORDER_BIG
231 #       endif /*! defined (__LITTLE_ENDIAN__) && !defined (__BIG_ENDIAN__) */
232 #   endif /*! defined(LITTLE_ENDIAN) || defined (BIG_ENDIAN) */
233 #endif /*! !defined(PLATFORM_BYTE_ORDER) */
234 #if !defined (PLATFORM_BYTE_ORDER)
235 #   if   defined (__alpha__) || defined (__alpha)    || defined (i386)       || \
236          defined (__i386__)  || defined (_M_I86)     || defined (_M_IX86)    || \
237          defined (__OS2__)   || defined (sun386)     || defined (__TURBOC__) || \
238          defined (vax)       || defined (vms)        || defined (VMS)        || \
239          defined (__VMS)     || defined (__x86_64__) || defined (_M_IA64)    || \
240          defined (_M_X64)    || defined (__i386)     || defined (__x86_64)
241 #       define PLATFORM_BYTE_ORDER GMQCC_BYTE_ORDER_LITTLE
242 #   elif defined (AMIGA)     || defined (applec)     || defined (__AS400__)  || \
243          defined (_CRAY)     || defined (__hppa)     || defined (__hp9000)   || \
244          defined (ibm370)    || defined (mc68000)    || defined (m68k)       || \
245          defined (__MRC__)   || defined (__MVS__)    || defined (__MWERKS__) || \
246          defined (sparc)     || defined (__sparc)    || defined (SYMANTEC_C) || \
247          defined (__TANDEM)  || defined (THINK_C)    || defined (__VMCMS__)  || \
248          defined (__PPC__)   || defined (__PPC)      || defined (PPC)
249 #       define PLATFORM_BYTE_ORDER GMQCC_BYTE_ORDER_BIG
250 #   else
251 #       define PLATFORM_BYTE_ORDER -1
252 #   endif
253 #endif /*! !defined (PLATFORM_BYTE_ORDER) */
254
255 /*
256  * On windows systems where we're not compiling with MING32 we need a
257  * little extra help on dependinces for implementing our own dirent.h
258  * in fs.c.
259  */
260 #if defined(_WIN32) && !defined(__MINGW32__)
261 #   define _WIN32_LEAN_AND_MEAN
262 #   include <windows.h>
263 #   include <io.h>
264 #   include <fcntl.h>
265
266     struct dirent {
267         long               d_ino;
268         unsigned short     d_reclen;
269         unsigned short     d_namlen;
270         char               d_name[FILENAME_MAX];
271     };
272
273     typedef struct {
274         struct _finddata_t dd_dta;
275         struct dirent      dd_dir;
276         long               dd_handle;
277         int                dd_stat;
278         char               dd_name[1];
279     } DIR;
280     /*
281      * Visual studio also lacks S_ISDIR for sys/stat.h, so we emulate this as well
282      * which is not hard at all.
283      */
284 #    ifdef S_ISDIR
285 #        undef  S_ISDIR
286 #    endif /*! S_ISDIR */
287 #   define S_ISDIR(X) ((X)&_S_IFDIR)
288 #else
289 #   include <dirent.h>
290 #endif /*! _WIN32 && !defined(__MINGW32__) */
291
292 /*===================================================================*/
293 /*=========================== stat.c ================================*/
294 /*===================================================================*/
295 void  stat_info          (void);
296 char *stat_mem_strdup    (const char *, size_t,         const char *, bool);
297 void *stat_mem_reallocate(void *,       size_t, size_t, const char *);
298 void  stat_mem_deallocate(void *);
299 void *stat_mem_allocate  (size_t, size_t, const char *);
300
301 #define mem_a(SIZE)              stat_mem_allocate  ((SIZE), __LINE__, __FILE__)
302 #define mem_d(PTRN)              stat_mem_deallocate((void*)(PTRN))
303 #define mem_r(PTRN, SIZE)        stat_mem_reallocate((void*)(PTRN), (SIZE), __LINE__, __FILE__)
304 #define mem_af(SIZE, FILE, LINE) stat_mem_allocate  ((SIZE), (LINE), (FILE))
305
306 /* TODO: rename to mem variations */
307 #define util_strdup(SRC)         stat_mem_strdup((char*)(SRC), __LINE__, __FILE__, false)
308 #define util_strdupe(SRC)        stat_mem_strdup((char*)(SRC), __LINE__, __FILE__, true)
309
310 /*===================================================================*/
311 /*=========================== util.c ================================*/
312 /*===================================================================*/
313
314 /*
315  * Microsoft implements against the spec versions of ctype.h. Which
316  * means what ever the current set locale is will render the actual
317  * results of say isalpha('A') wrong for what ever retarded locale
318  * is used. Simalerly these are also implemented inefficently on
319  * some toolchains and end up becoming actual library calls. Perhaps
320  * this is why tools like yacc provide their own? Regardless implementing
321  * these as functions is equally as silly, the call overhead is not
322  * justified when this could happen on every character from an input
323  * stream. We provide our own as macros for absolute inlinability.
324  */
325 #define util_isalpha(a) ((((unsigned)(a)|32)-'a') < 26)
326 #define util_isdigit(a) (((unsigned)(a)-'0') < 10)
327 #define util_islower(a) (((unsigned)(a)-'a') < 26)
328 #define util_isupper(a) (((unsigned)(a)-'A') < 26)
329 #define util_isprint(a) (((unsigned)(a)-0x20) < 0x5F)
330 #define util_isspace(a) (((a) >= 9 && (a) <= 13) || (a) == ' ')
331
332 bool  util_filexists     (const char *);
333 bool  util_strupper      (const char *);
334 bool  util_strdigit      (const char *);
335 void  util_endianswap    (void *,  size_t, unsigned int);
336
337 size_t util_strtocmd         (const char *, char *, size_t);
338 size_t util_strtononcmd      (const char *, char *, size_t);
339 size_t util_optimizationtostr(const char *, char *, size_t);
340
341 uint16_t util_crc16(uint16_t crc, const char *data, size_t len);
342
343 void     util_seed(uint32_t);
344 uint32_t util_rand(void);
345
346 /*
347  * String functions (formatting, copying, concatenating, errors). These are wrapped
348  * to use the MSVC _safe_ versions when using MSVC, plus some implementations of
349  * these are non-conformant or don't exist such as asprintf and snprintf, which are
350  * not supported in C90, but do exist in C99.
351  */
352 int         util_vasprintf(char **ret, const char *fmt, va_list);
353 int         util_asprintf (char **ret, const char *fmt, ...);
354 int         util_snprintf (char *src,  size_t bytes, const char *format, ...);
355 char       *util_strcat   (char *dest, const char *src);
356 char       *util_strncpy  (char *dest, const char *src, size_t num);
357 const char *util_strerror (int num);
358
359 /*
360  * A flexible vector implementation: all vector pointers contain some
361  * data about themselfs exactly - sizeof(vector_t) behind the pointer
362  * this data is represented in the structure below.  Doing this allows
363  * us to use the array [] to access individual elements from the vector
364  * opposed to using set/get methods.
365  */
366 typedef struct {
367     size_t  allocated;
368     size_t  used;
369
370     /* can be extended now! whoot */
371 } vector_t;
372
373 /* hidden interface */
374 void _util_vec_grow(void **a, size_t i, size_t s);
375 #define GMQCC_VEC_WILLGROW(X,Y) ( \
376     ((!(X) || vec_meta(X)->used + Y >= vec_meta(X)->allocated)) ? \
377         (void)_util_vec_grow(((void**)&(X)), (Y), sizeof(*(X))) : \
378         (void)0                                                   \
379 )
380
381 /* exposed interface */
382 #define vec_meta(A)       (((vector_t*)((void*)A)) - 1)
383 #define vec_free(A)       ((void)((A) ? (mem_d((void*)vec_meta(A)), (A) = NULL) : 0))
384 #define vec_push(A,V)     (GMQCC_VEC_WILLGROW((A),1), (A)[vec_meta(A)->used++] = (V))
385 #define vec_size(A)       ((A) ? vec_meta(A)->used : 0)
386 #define vec_add(A,N)      (GMQCC_VEC_WILLGROW((A),(N)), vec_meta(A)->used += (N), &(A)[vec_meta(A)->used-(N)])
387 #define vec_last(A)       ((A)[vec_meta(A)->used - 1])
388 #define vec_pop(A)        ((void)(vec_meta(A)->used -= 1))
389 #define vec_shrinkto(A,N) ((void)(vec_meta(A)->used  = (N)))
390 #define vec_shrinkby(A,N) ((void)(vec_meta(A)->used -= (N)))
391 #define vec_append(A,N,S) ((void)(memcpy(vec_add((A), (N)), (S), (N) * sizeof(*(S)))))
392 #define vec_remove(A,I,N) ((void)(memmove((A)+(I),(A)+((I)+(N)),sizeof(*(A))*(vec_meta(A)->used-(I)-(N))),vec_meta(A)->used-=(N)))
393
394 typedef struct correct_trie_s {
395     void                  *value;
396     struct correct_trie_s *entries;
397 } correct_trie_t;
398
399 correct_trie_t* correct_trie_new(void);
400
401 typedef struct hash_table_s {
402     size_t                size;
403     struct hash_node_t **table;
404 } hash_table_t, *ht;
405
406 /*
407  * hashtable implementation:
408  *
409  * Note:
410  *      This was designed for pointers:  you manage the life of the object yourself
411  *      if you do use this for non-pointers please be warned that the object may not
412  *      be valid if the duration of it exceeds (i.e on stack).  So you need to allocate
413  *      yourself, or put those in global scope to ensure duration is for the whole
414  *      runtime.
415  *
416  * util_htnew(size)                             -- to make a new hashtable
417  * util_htset(table, key, value, sizeof(value)) -- to set something in the table
418  * util_htget(table, key)                       -- to get something from the table
419  * util_htdel(table)                            -- to delete the table
420  *
421  * example of use:
422  *
423  * ht    foo  = util_htnew(1024);
424  * int   data = 100;
425  * char *test = "hello world\n";
426  * util_htset(foo, "foo", (void*)&data);
427  * util_gtset(foo, "bar", (void*)test);
428  *
429  * printf("foo: %d, bar %s",
430  *     *((int *)util_htget(foo, "foo")),
431  *      ((char*)util_htget(foo, "bar"))
432  * );
433  *
434  * util_htdel(foo);
435  */
436 hash_table_t *util_htnew (size_t size);
437 void          util_htrem (hash_table_t *ht, void (*callback)(void *data));
438 void          util_htset (hash_table_t *ht, const char *key, void *value);
439 void          util_htdel (hash_table_t *ht);
440 size_t        util_hthash(hash_table_t *ht, const char *key);
441 void          util_htseth(hash_table_t *ht, const char *key, size_t hash, void *value);
442 void          util_htrmh (hash_table_t *ht, const char *key, size_t bin, void (*cb)(void*));
443 void          util_htrm  (hash_table_t *ht, const char *key, void (*cb)(void*));
444
445 void         *util_htget (hash_table_t *ht, const char *key);
446 void         *util_htgeth(hash_table_t *ht, const char *key, size_t hash);
447
448 /*===================================================================*/
449 /*============================ file.c ===============================*/
450 /*===================================================================*/
451 /* file handling */
452 void           fs_file_close  (FILE *);
453 int            fs_file_error  (FILE *);
454 int            fs_file_getc   (FILE *);
455 int            fs_file_printf (FILE *, const char *, ...);
456 int            fs_file_puts   (FILE *, const char *);
457 int            fs_file_seek   (FILE *, long int, int);
458 long int       fs_file_tell   (FILE *);
459
460 size_t         fs_file_read   (void *,        size_t, size_t, FILE *);
461 size_t         fs_file_write  (const void *,  size_t, size_t, FILE *);
462
463 FILE          *fs_file_open   (const char *, const char *);
464 int            fs_file_getline(char  **, size_t *, FILE *);
465
466 /* directory handling */
467 int            fs_dir_make    (const char *);
468 DIR           *fs_dir_open    (const char *);
469 int            fs_dir_close   (DIR *);
470 struct dirent *fs_dir_read    (DIR *);
471
472
473 /*===================================================================*/
474 /*=========================== correct.c =============================*/
475 /*===================================================================*/
476 typedef struct {
477     char   ***edits;
478     size_t  **lens;
479 } correction_t;
480
481 void  correct_del (correct_trie_t*, size_t **);
482 void  correct_add (correct_trie_t*, size_t ***, const char *);
483 char *correct_str (correction_t *, correct_trie_t*, const char *);
484 void  correct_init(correction_t *);
485 void  correct_free(correction_t *);
486
487 /*===================================================================*/
488 /*=========================== code.c ================================*/
489 /*===================================================================*/
490
491 /* Note: if you change the order, fix type_sizeof in ir.c */
492 enum {
493     TYPE_VOID     ,
494     TYPE_STRING   ,
495     TYPE_FLOAT    ,
496     TYPE_VECTOR   ,
497     TYPE_ENTITY   ,
498     TYPE_FIELD    ,
499     TYPE_FUNCTION ,
500     TYPE_POINTER  ,
501     TYPE_INTEGER  ,
502     TYPE_VARIANT  ,
503     TYPE_STRUCT   ,
504     TYPE_UNION    ,
505     TYPE_ARRAY    ,
506
507     TYPE_NIL      , /* it's its own type / untyped */
508     TYPE_NOEXPR   , /* simply invalid in expressions */
509
510     TYPE_COUNT
511 };
512
513 /* const/var qualifiers */
514 #define CV_NONE   0
515 #define CV_CONST  1
516 #define CV_VAR   -1
517 #define CV_WRONG  0x8000 /* magic number to help parsing */
518
519 extern const char    *type_name        [TYPE_COUNT];
520 extern const uint16_t type_store_instr [TYPE_COUNT];
521 extern const uint16_t field_store_instr[TYPE_COUNT];
522
523 /*
524  * could use type_store_instr + INSTR_STOREP_F - INSTR_STORE_F
525  * but this breaks when TYPE_INTEGER is added, since with the enhanced
526  * instruction set, the old ones are left untouched, thus the _I instructions
527  * are at a seperate place.
528  */
529 extern const uint16_t type_storep_instr[TYPE_COUNT];
530 extern const uint16_t type_eq_instr    [TYPE_COUNT];
531 extern const uint16_t type_ne_instr    [TYPE_COUNT];
532 extern const uint16_t type_not_instr   [TYPE_COUNT];
533
534 typedef struct {
535     uint32_t offset;      /* Offset in file of where data begins  */
536     uint32_t length;      /* Length of section (how many of)      */
537 } prog_section_t;
538
539 typedef struct {
540     uint32_t       version;      /* Program version (6)     */
541     uint16_t       crc16;
542     uint16_t       skip;
543
544     prog_section_t statements;   /* prog_section_statement  */
545     prog_section_t defs;         /* prog_section_def        */
546     prog_section_t fields;       /* prog_section_field      */
547     prog_section_t functions;    /* prog_section_function   */
548     prog_section_t strings;
549     prog_section_t globals;
550     uint32_t       entfield;     /* Number of entity fields */
551 } prog_header_t;
552
553 /*
554  * Each paramater incerements by 3 since vector types hold
555  * 3 components (x,y,z).
556  */
557 #define OFS_NULL      0
558 #define OFS_RETURN    1
559 #define OFS_PARM0     (OFS_RETURN+3)
560 #define OFS_PARM1     (OFS_PARM0 +3)
561 #define OFS_PARM2     (OFS_PARM1 +3)
562 #define OFS_PARM3     (OFS_PARM2 +3)
563 #define OFS_PARM4     (OFS_PARM3 +3)
564 #define OFS_PARM5     (OFS_PARM4 +3)
565 #define OFS_PARM6     (OFS_PARM5 +3)
566 #define OFS_PARM7     (OFS_PARM6 +3)
567
568 typedef struct {
569     uint16_t opcode;
570
571     /* operand 1 */
572     union {
573         int16_t  s1; /* signed   */
574         uint16_t u1; /* unsigned */
575     } o1;
576     /* operand 2 */
577     union {
578         int16_t  s1; /* signed   */
579         uint16_t u1; /* unsigned */
580     } o2;
581     /* operand 3 */
582     union {
583         int16_t  s1; /* signed   */
584         uint16_t u1; /* unsigned */
585     } o3;
586
587     /*
588      * This is the same as the structure in darkplaces
589      * {
590      *     unsigned short op;
591      *     short          a,b,c;
592      * }
593      * But this one is more sane to work with, and the
594      * type sizes are guranteed.
595      */
596 } prog_section_statement_t;
597
598 typedef struct {
599     /*
600      * The types:
601      * 0 = ev_void
602      * 1 = ev_string
603      * 2 = ev_float
604      * 3 = ev_vector
605      * 4 = ev_entity
606      * 5 = ev_field
607      * 6 = ev_function
608      * 7 = ev_pointer -- engine only
609      * 8 = ev_bad     -- engine only
610      */
611     uint16_t type;
612     uint16_t offset;
613     uint32_t name;
614 } prog_section_both_t;
615
616 typedef prog_section_both_t prog_section_def_t;
617 typedef prog_section_both_t prog_section_field_t;
618
619 /* this is ORed to the type */
620 #define DEF_SAVEGLOBAL (1<<15)
621 #define DEF_TYPEMASK   ((1<<15)-1)
622
623 typedef struct {
624     int32_t   entry;      /* in statement table for instructions  */
625     uint32_t  firstlocal; /* First local in local table           */
626     uint32_t  locals;     /* Total ints of params + locals        */
627     uint32_t  profile;    /* Always zero (engine uses this)       */
628     uint32_t  name;       /* name of function in string table     */
629     uint32_t  file;       /* file of the source file              */
630     int32_t   nargs;      /* number of arguments                  */
631     uint8_t   argsize[8]; /* size of arguments (keep 8 always?)   */
632 } prog_section_function_t;
633
634 /*
635  * Instructions
636  * These are the external instructions supported by the interperter
637  * this is what things compile to (from the C code).
638  */
639 enum {
640     INSTR_DONE,
641     INSTR_MUL_F,
642     INSTR_MUL_V,
643     INSTR_MUL_FV, /* NOTE: the float operands must NOT be at the same locations: A != C */
644     INSTR_MUL_VF, /* and here: B != C */
645     INSTR_DIV_F,
646     INSTR_ADD_F,
647     INSTR_ADD_V,
648     INSTR_SUB_F,
649     INSTR_SUB_V,
650     INSTR_EQ_F,
651     INSTR_EQ_V,
652     INSTR_EQ_S,
653     INSTR_EQ_E,
654     INSTR_EQ_FNC,
655     INSTR_NE_F,
656     INSTR_NE_V,
657     INSTR_NE_S,
658     INSTR_NE_E,
659     INSTR_NE_FNC,
660     INSTR_LE,
661     INSTR_GE,
662     INSTR_LT,
663     INSTR_GT,
664     INSTR_LOAD_F,
665     INSTR_LOAD_V,
666     INSTR_LOAD_S,
667     INSTR_LOAD_ENT,
668     INSTR_LOAD_FLD,
669     INSTR_LOAD_FNC,
670     INSTR_ADDRESS,
671     INSTR_STORE_F,
672     INSTR_STORE_V,
673     INSTR_STORE_S,
674     INSTR_STORE_ENT,
675     INSTR_STORE_FLD,
676     INSTR_STORE_FNC,
677     INSTR_STOREP_F,
678     INSTR_STOREP_V,
679     INSTR_STOREP_S,
680     INSTR_STOREP_ENT,
681     INSTR_STOREP_FLD,
682     INSTR_STOREP_FNC,
683     INSTR_RETURN,
684     INSTR_NOT_F,
685     INSTR_NOT_V,
686     INSTR_NOT_S,
687     INSTR_NOT_ENT,
688     INSTR_NOT_FNC,
689     INSTR_IF,
690     INSTR_IFNOT,
691     INSTR_CALL0,
692     INSTR_CALL1,
693     INSTR_CALL2,
694     INSTR_CALL3,
695     INSTR_CALL4,
696     INSTR_CALL5,
697     INSTR_CALL6,
698     INSTR_CALL7,
699     INSTR_CALL8,
700     INSTR_STATE,
701     INSTR_GOTO,
702     INSTR_AND,
703     INSTR_OR,
704     INSTR_BITAND,
705     INSTR_BITOR,
706
707     /*
708      * Virtual instructions used by the IR
709      * Keep at the end!
710      */
711     VINSTR_END,
712     VINSTR_PHI,
713     VINSTR_JUMP,
714     VINSTR_COND,
715
716     /* A never returning CALL.
717      * Creating this causes IR blocks to be marked as 'final'.
718      * No-Return-Call
719      */
720     VINSTR_NRCALL,
721
722     /* Emulated instructions. */
723     VINSTR_BITAND_V, /* BITAND_V must be the first emulated bitop */
724     VINSTR_BITAND_VF,
725     VINSTR_BITOR_V,
726     VINSTR_BITOR_VF,
727     VINSTR_BITXOR,
728     VINSTR_BITXOR_V,
729     VINSTR_BITXOR_VF,
730     VINSTR_CROSS,
731     VINSTR_NEG_F,
732     VINSTR_NEG_V
733 };
734
735 /* TODO: elide */
736 extern const char *util_instr_str[VINSTR_END];
737
738
739 typedef float    qcfloat_t;
740 typedef int32_t  qcint_t;
741 typedef uint32_t qcuint_t;
742
743 typedef struct {
744     prog_section_statement_t *statements;
745     int                      *linenums;
746     int                      *columnnums;
747     prog_section_def_t       *defs;
748     prog_section_field_t     *fields;
749     prog_section_function_t  *functions;
750     int                      *globals;
751     char                     *chars;
752     uint16_t                  crc;
753     uint32_t                  entfields;
754     ht                        string_cache;
755     qcint_t                   string_cached_empty;
756 } code_t;
757
758 /*
759  * A shallow copy of a lex_file to remember where which ast node
760  * came from.
761  */
762 typedef struct {
763     const char *file;
764     size_t      line;
765     size_t      column;
766 } lex_ctx_t;
767
768 /*
769  * code_write          -- writes out the compiled file
770  * code_init           -- prepares the code file
771  * code_genstrin       -- generates string for code
772  * code_alloc_field    -- allocated a field
773  * code_push_statement -- keeps statements and linenumbers together
774  * code_pop_statement  -- keeps statements and linenumbers together
775  */
776 bool      code_write         (code_t *, const char *filename, const char *lno);
777 GMQCC_WARN
778 code_t   *code_init          (void);
779 void      code_cleanup       (code_t *);
780 uint32_t  code_genstring     (code_t *, const char *string);
781 qcint_t   code_alloc_field   (code_t *, size_t qcsize);
782 void      code_push_statement(code_t *, prog_section_statement_t *stmt, lex_ctx_t ctx);
783 void      code_pop_statement (code_t *);
784
785
786 /*===================================================================*/
787 /*============================ con.c ================================*/
788 /*===================================================================*/
789 enum {
790     CON_BLACK   = 30,
791     CON_RED,
792     CON_GREEN,
793     CON_BROWN,
794     CON_BLUE,
795     CON_MAGENTA,
796     CON_CYAN ,
797     CON_WHITE
798 };
799
800 /* message level */
801 enum {
802     LVL_MSG,
803     LVL_WARNING,
804     LVL_ERROR
805 };
806
807 FILE *con_default_out(void);
808 FILE *con_default_err(void);
809
810 void con_vprintmsg (int level, const char *name, size_t line, size_t column, const char *msgtype, const char *msg, va_list ap);
811 void con_printmsg  (int level, const char *name, size_t line, size_t column, const char *msgtype, const char *msg, ...);
812 void con_cvprintmsg(lex_ctx_t ctx, int lvl, const char *msgtype, const char *msg, va_list ap);
813 void con_cprintmsg (lex_ctx_t ctx, int lvl, const char *msgtype, const char *msg, ...);
814
815 void con_close (void);
816 void con_init  (void);
817 void con_reset (void);
818 void con_color (int);
819 int  con_change(const char *, const char *);
820 int  con_verr  (const char *, va_list);
821 int  con_vout  (const char *, va_list);
822 int  con_err   (const char *, ...);
823 int  con_out   (const char *, ...);
824
825 /* error/warning interface */
826 extern size_t compile_errors;
827 extern size_t compile_Werrors;
828 extern size_t compile_warnings;
829
830 void /********/ compile_error   (lex_ctx_t ctx, /*LVL_ERROR*/ const char *msg, ...);
831 void /********/ vcompile_error  (lex_ctx_t ctx, /*LVL_ERROR*/ const char *msg, va_list ap);
832 bool GMQCC_WARN compile_warning (lex_ctx_t ctx, int warntype, const char *fmt, ...);
833 bool GMQCC_WARN vcompile_warning(lex_ctx_t ctx, int warntype, const char *fmt, va_list ap);
834 void            compile_show_werrors(void);
835
836 /*===================================================================*/
837 /*============================= ir.c ================================*/
838 /*===================================================================*/
839
840 enum store_types {
841     store_global,
842     store_local,  /* local, assignable for now, should get promoted later */
843     store_param,  /* parameters, they are locals with a fixed position */
844     store_value,  /* unassignable */
845     store_return  /* unassignable, at OFS_RETURN */
846 };
847
848 typedef struct {
849     qcfloat_t x, y, z;
850 } vec3_t;
851
852 /*===================================================================*/
853 /*============================= exec.c ==============================*/
854 /*===================================================================*/
855
856 /* TODO: cleanup */
857 /*
858  * Darkplaces has (or will have) a 64 bit prog loader
859  * where the 32 bit qc program is autoconverted on load.
860  * Since we may want to support that as well, let's redefine
861  * float and int here.
862  */
863 typedef union {
864     qcint_t   _int;
865     qcint_t    string;
866     qcint_t    function;
867     qcint_t    edict;
868     qcfloat_t _float;
869     qcfloat_t vector[3];
870     qcint_t   ivector[3];
871 } qcany_t;
872
873 typedef char qcfloat_t_size_is_correct [sizeof(qcfloat_t) == 4 ?1:-1];
874 typedef char qcint_t_size_is_correct   [sizeof(qcint_t)   == 4 ?1:-1];
875
876 enum {
877     VMERR_OK,
878     VMERR_TEMPSTRING_ALLOC,
879     VMERR_END
880 };
881
882 #define VM_JUMPS_DEFAULT 1000000
883
884 /* execute-flags */
885 #define VMXF_DEFAULT 0x0000     /* default flags - nothing */
886 #define VMXF_TRACE   0x0001     /* trace: print statements before executing */
887 #define VMXF_PROFILE 0x0002     /* profile: increment the profile counters */
888
889 struct qc_program_s;
890 typedef int (*prog_builtin_t)(struct qc_program_s *prog);
891
892 typedef struct {
893     qcint_t                    stmt;
894     size_t                   localsp;
895     prog_section_function_t *function;
896 } qc_exec_stack_t;
897
898 typedef struct qc_program_s {
899     char                    *filename;
900     prog_section_statement_t *code;
901     prog_section_def_t       *defs;
902     prog_section_def_t       *fields;
903     prog_section_function_t  *functions;
904     char                    *strings;
905     qcint_t                   *globals;
906     qcint_t                   *entitydata;
907     bool                    *entitypool;
908
909     const char*             *function_stack;
910
911     uint16_t crc16;
912
913     size_t tempstring_start;
914     size_t tempstring_at;
915
916     qcint_t  vmerror;
917
918     size_t *profile;
919
920     prog_builtin_t *builtins;
921     size_t          builtins_count;
922
923     /* size_t ip; */
924     qcint_t  entities;
925     size_t entityfields;
926     bool   allowworldwrites;
927
928     qcint_t         *localstack;
929     qc_exec_stack_t *stack;
930     size_t statement;
931
932     size_t xflags;
933
934     int    argc; /* current arg count for debugging */
935 } qc_program_t;
936
937 qc_program_t*       prog_load      (const char *filename, bool ignoreversion);
938 void                prog_delete    (qc_program_t *prog);
939 bool                prog_exec      (qc_program_t *prog, prog_section_function_t *func, size_t flags, long maxjumps);
940 const char*         prog_getstring (qc_program_t *prog, qcint_t str);
941 prog_section_def_t* prog_entfield  (qc_program_t *prog, qcint_t off);
942 prog_section_def_t* prog_getdef    (qc_program_t *prog, qcint_t off);
943 qcany_t*            prog_getedict  (qc_program_t *prog, qcint_t e);
944 qcint_t               prog_tempstring(qc_program_t *prog, const char *_str);
945
946
947 /*===================================================================*/
948 /*===================== parser.c commandline ========================*/
949 /*===================================================================*/
950 struct parser_s;
951 struct parser_s *parser_create        (void);
952 bool             parser_compile_file  (struct parser_s *parser, const char *);
953 bool             parser_compile_string(struct parser_s *parser, const char *, const char *, size_t);
954 bool             parser_finish        (struct parser_s *parser, const char *);
955 void             parser_cleanup       (struct parser_s *parser);
956
957 /*===================================================================*/
958 /*====================== ftepp.c commandline ========================*/
959 /*===================================================================*/
960 struct ftepp_s;
961 struct ftepp_s *ftepp_create           (void);
962 bool            ftepp_preprocess_file  (struct ftepp_s *ftepp, const char *filename);
963 bool            ftepp_preprocess_string(struct ftepp_s *ftepp, const char *name, const char *str);
964 void            ftepp_finish           (struct ftepp_s *ftepp);
965 const char     *ftepp_get              (struct ftepp_s *ftepp);
966 void            ftepp_flush            (struct ftepp_s *ftepp);
967 void            ftepp_add_define       (struct ftepp_s *ftepp, const char *source, const char *name);
968 void            ftepp_add_macro        (struct ftepp_s *ftepp, const char *name,   const char *value);
969
970 /*===================================================================*/
971 /*======================= main.c commandline ========================*/
972 /*===================================================================*/
973
974 #if 1
975 /* Helpers to allow for a whole lot of flags. Otherwise we'd limit
976  * to 32 or 64 -f options...
977  */
978 typedef struct {
979     size_t  idx; /* index into an array of 32 bit words */
980     uint8_t bit; /* bit index for the 8 bit group idx points to */
981 } longbit;
982 #define LONGBIT(bit) { ((bit)/32), ((bit)%32) }
983 #define LONGBIT_SET(B, I) ((B).idx = (I)/32, (B).bit = ((I)%32))
984 #else
985 typedef uint32_t longbit;
986 #define LONGBIT(bit) (bit)
987 #define LONGBIT_SET(B, I) ((B) = (I))
988 #endif
989
990 /*===================================================================*/
991 /*============================= utf8.c ==============================*/
992 /*===================================================================*/
993 typedef long utf8ch_t;
994 int utf8_from(char *, utf8ch_t);
995 int utf8_to(utf8ch_t *, const unsigned char *, size_t);
996
997 /*===================================================================*/
998 /*============================= opts.c ==============================*/
999 /*===================================================================*/
1000 typedef struct {
1001     const char *name;
1002     longbit     bit;
1003 } opts_flag_def_t;
1004
1005 bool opts_setflag  (const char *, bool);
1006 bool opts_setwarn  (const char *, bool);
1007 bool opts_setwerror(const char *, bool);
1008 bool opts_setoptim (const char *, bool);
1009
1010 void opts_init         (const char *, int, size_t);
1011 void opts_set          (uint32_t   *, size_t, bool);
1012 void opts_setoptimlevel(unsigned int);
1013 void opts_ini_init     (const char *);
1014
1015 /* Saner flag handling */
1016 void opts_backup_non_Wall(void);
1017 void opts_restore_non_Wall(void);
1018 void opts_backup_non_Werror_all(void);
1019 void opts_restore_non_Werror_all(void);
1020
1021
1022 enum {
1023 # define GMQCC_TYPE_FLAGS
1024 # define GMQCC_DEFINE_FLAG(X) X,
1025 #  include "opts.def"
1026     COUNT_FLAGS
1027 };
1028
1029 enum {
1030 # define GMQCC_TYPE_WARNS
1031 # define GMQCC_DEFINE_FLAG(X) WARN_##X,
1032 #  include "opts.def"
1033     COUNT_WARNINGS
1034 };
1035
1036 enum {
1037 # define GMQCC_TYPE_OPTIMIZATIONS
1038 # define GMQCC_DEFINE_FLAG(NAME, MIN_O) OPTIM_##NAME,
1039 #  include "opts.def"
1040     COUNT_OPTIMIZATIONS
1041 };
1042
1043 enum {
1044 #   define GMQCC_TYPE_OPTIONS
1045 #   define GMQCC_DEFINE_FLAG(X) OPTION_##X,
1046 #   include "opts.def"
1047     OPTION_COUNT
1048 };
1049
1050 extern const opts_flag_def_t opts_flag_list[COUNT_FLAGS+1];
1051 extern const opts_flag_def_t opts_warn_list[COUNT_WARNINGS+1];
1052 extern const opts_flag_def_t opts_opt_list[COUNT_OPTIMIZATIONS+1];
1053 extern const unsigned int    opts_opt_oflag[COUNT_OPTIMIZATIONS+1];
1054 extern unsigned int          opts_optimizationcount[COUNT_OPTIMIZATIONS];
1055
1056 /* other options: */
1057 typedef enum {
1058     COMPILER_QCC,     /* circa  QuakeC */
1059     COMPILER_FTEQCC,  /* fteqcc QuakeC */
1060     COMPILER_QCCX,    /* qccx   QuakeC */
1061     COMPILER_GMQCC    /* this   QuakeC */
1062 } opts_std_t;
1063
1064 typedef union {
1065     bool     B;
1066     uint16_t U16;
1067     uint32_t U32;
1068     char    *STR;
1069 } opt_value_t;
1070
1071
1072 typedef struct {
1073     opt_value_t  options      [OPTION_COUNT];
1074     uint32_t     flags        [1 + (COUNT_FLAGS         / 32)];
1075     uint32_t     warn         [1 + (COUNT_WARNINGS      / 32)];
1076     uint32_t     werror       [1 + (COUNT_WARNINGS      / 32)];
1077     uint32_t     warn_backup  [1 + (COUNT_WARNINGS      / 32)];
1078     uint32_t     werror_backup[1 + (COUNT_WARNINGS      / 32)];
1079     uint32_t     optimization [1 + (COUNT_OPTIMIZATIONS / 32)];
1080     bool         optimizeoff; /* True when -O0 */
1081 } opts_cmd_t;
1082
1083 extern opts_cmd_t opts;
1084
1085 #define OPTS_GENERIC(f,i)    (!! (((f)[(i)/32]) & (1<< (unsigned)((i)%32))))
1086 #define OPTS_FLAG(i)         OPTS_GENERIC(opts.flags,        (i))
1087 #define OPTS_WARN(i)         OPTS_GENERIC(opts.warn,         (i))
1088 #define OPTS_WERROR(i)       OPTS_GENERIC(opts.werror,       (i))
1089 #define OPTS_OPTIMIZATION(i) OPTS_GENERIC(opts.optimization, (i))
1090 #define OPTS_OPTION_BOOL(X) (opts.options[X].B)
1091 #define OPTS_OPTION_U16(X)  (opts.options[X].U16)
1092 #define OPTS_OPTION_U32(X)  (opts.options[X].U32)
1093 #define OPTS_OPTION_STR(X)  (opts.options[X].STR)
1094
1095 #endif /*! GMQCC_HDR */