[BACK]Return to glob.c CVS log [TXT][DIR] Up to [cvs.NetBSD.org] / src / lib / libc / gen

Annotation of src/lib/libc/gen/glob.c, Revision 1.23.10.2

1.23.10.2! riz         1: /*     $NetBSD: glob.c,v 1.29 2011/01/22 16:24:44 christos Exp $       */
1.5       cgd         2:
1.1       cgd         3: /*
1.12      christos    4:  * Copyright (c) 1989, 1993
                      5:  *     The Regents of the University of California.  All rights reserved.
                      6:  *
                      7:  * This code is derived from software contributed to Berkeley by
                      8:  * Guido van Rossum.
                      9:  *
                     10:  * Redistribution and use in source and binary forms, with or without
                     11:  * modification, are permitted provided that the following conditions
                     12:  * are met:
                     13:  * 1. Redistributions of source code must retain the above copyright
                     14:  *    notice, this list of conditions and the following disclaimer.
                     15:  * 2. Redistributions in binary form must reproduce the above copyright
                     16:  *    notice, this list of conditions and the following disclaimer in the
                     17:  *    documentation and/or other materials provided with the distribution.
                     18:  * 3. Neither the name of the University nor the names of its contributors
                     19:  *    may be used to endorse or promote products derived from this software
                     20:  *    without specific prior written permission.
                     21:  *
                     22:  * THIS SOFTWARE IS PROVIDED BY THE REGENTS AND CONTRIBUTORS ``AS IS'' AND
                     23:  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
                     24:  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
                     25:  * ARE DISCLAIMED.  IN NO EVENT SHALL THE REGENTS OR CONTRIBUTORS BE LIABLE
                     26:  * FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL, EXEMPLARY, OR CONSEQUENTIAL
                     27:  * DAMAGES (INCLUDING, BUT NOT LIMITED TO, PROCUREMENT OF SUBSTITUTE GOODS
                     28:  * OR SERVICES; LOSS OF USE, DATA, OR PROFITS; OR BUSINESS INTERRUPTION)
                     29:  * HOWEVER CAUSED AND ON ANY THEORY OF LIABILITY, WHETHER IN CONTRACT, STRICT
                     30:  * LIABILITY, OR TORT (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY
                     31:  * OUT OF THE USE OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF
                     32:  * SUCH DAMAGE.
1.1       cgd        33:  */
                     34:
1.12      christos   35: #include <sys/cdefs.h>
                     36: #if defined(LIBC_SCCS) && !defined(lint)
                     37: #if 0
                     38: static char sccsid[] = "@(#)glob.c     8.3 (Berkeley) 10/13/93";
                     39: #else
1.23.10.2! riz        40: __RCSID("$NetBSD: glob.c,v 1.23.10.1 2010/07/19 18:15:17 riz Exp $");
1.12      christos   41: #endif
                     42: #endif /* LIBC_SCCS and not lint */
1.1       cgd        43:
1.12      christos   44: /*
                     45:  * glob(3) -- a superset of the one defined in POSIX 1003.2.
                     46:  *
                     47:  * The [!...] convention to negate a range is supported (SysV, Posix, ksh).
                     48:  *
                     49:  * Optional extra services, controlled by flags not defined by POSIX:
                     50:  *
                     51:  * GLOB_MAGCHAR:
                     52:  *     Set in gl_flags if pattern contained a globbing character.
                     53:  * GLOB_NOMAGIC:
                     54:  *     Same as GLOB_NOCHECK, but it will only append pattern if it did
                     55:  *     not contain any magic characters.  [Used in csh style globbing]
                     56:  * GLOB_ALTDIRFUNC:
                     57:  *     Use alternately specified directory access functions.
                     58:  * GLOB_TILDE:
                     59:  *     expand ~user/foo to the /home/dir/of/user/foo
                     60:  * GLOB_BRACE:
                     61:  *     expand {1,2}{a,b} to 1a 1b 2a 2b
1.19      christos   62:  * GLOB_PERIOD:
                     63:  *     allow metacharacters to match leading dots in filenames.
1.22      christos   64:  * GLOB_NO_DOTDIRS:
                     65:  *     . and .. are hidden from wildcards, even if GLOB_PERIOD is set.
1.12      christos   66:  * gl_matchc:
                     67:  *     Number of matches in the current invocation of glob.
                     68:  */
                     69:
                     70: #include "namespace.h"
                     71: #include <sys/param.h>
                     72: #include <sys/stat.h>
                     73:
                     74: #include <assert.h>
                     75: #include <ctype.h>
                     76: #include <dirent.h>
                     77: #include <errno.h>
                     78: #include <glob.h>
                     79: #include <pwd.h>
                     80: #include <stdio.h>
1.21      christos   81: #include <stddef.h>
1.12      christos   82: #include <stdlib.h>
                     83: #include <string.h>
                     84: #include <unistd.h>
                     85:
                     86: #ifdef HAVE_NBTOOL_CONFIG_H
                     87: #define NO_GETPW_R
                     88: #endif
                     89:
1.23.10.2! riz        90: #define        GLOB_LIMIT_STRING       65536   /* number of readdirs */
        !            91: #define        GLOB_LIMIT_STAT         128     /* number of stat system calls */
        !            92: #define        GLOB_LIMIT_READDIR      16384   /* total buffer size of path strings */
        !            93: #define        GLOB_LIMIT_PATH         1024    /* number of path elements */
        !            94: #define GLOB_LIMIT_BRACE       128     /* Number of brace calls */
        !            95:
        !            96: struct glob_limit {
        !            97:        size_t l_string;
        !            98:        size_t l_stat;
        !            99:        size_t l_readdir;
        !           100:        size_t l_brace;
        !           101: };
1.23      ad        102:
1.12      christos  103: /*
                    104:  * XXX: For NetBSD 1.4.x compatibility. (kill me l8r)
                    105:  */
                    106: #ifndef _DIAGASSERT
                    107: #define _DIAGASSERT(a)
                    108: #endif
                    109:
                    110: #define        DOLLAR          '$'
                    111: #define        DOT             '.'
                    112: #define        EOS             '\0'
                    113: #define        LBRACKET        '['
                    114: #define        NOT             '!'
                    115: #define        QUESTION        '?'
                    116: #define        QUOTE           '\\'
                    117: #define        RANGE           '-'
                    118: #define        RBRACKET        ']'
                    119: #define        SEP             '/'
                    120: #define        STAR            '*'
                    121: #define        TILDE           '~'
                    122: #define        UNDERSCORE      '_'
                    123: #define        LBRACE          '{'
                    124: #define        RBRACE          '}'
                    125: #define        SLASH           '/'
                    126: #define        COMMA           ','
                    127:
1.15      christos  128: #ifndef USE_8BIT_CHARS
1.12      christos  129:
                    130: #define        M_QUOTE         0x8000
                    131: #define        M_PROTECT       0x4000
                    132: #define        M_MASK          0xffff
                    133: #define        M_ASCII         0x00ff
                    134:
                    135: typedef u_short Char;
                    136:
                    137: #else
                    138:
1.15      christos  139: #define        M_QUOTE         (Char)0x80
                    140: #define        M_PROTECT       (Char)0x40
                    141: #define        M_MASK          (Char)0xff
                    142: #define        M_ASCII         (Char)0x7f
1.12      christos  143:
                    144: typedef char Char;
                    145:
                    146: #endif
                    147:
                    148:
                    149: #define        CHAR(c)         ((Char)((c)&M_ASCII))
                    150: #define        META(c)         ((Char)((c)|M_QUOTE))
                    151: #define        M_ALL           META('*')
                    152: #define        M_END           META(']')
                    153: #define        M_NOT           META('!')
                    154: #define        M_ONE           META('?')
                    155: #define        M_RNG           META('-')
                    156: #define        M_SET           META('[')
                    157: #define        ismeta(c)       (((c)&M_QUOTE) != 0)
                    158:
                    159:
1.18      christos  160: static int      compare(const void *, const void *);
                    161: static int      g_Ctoc(const Char *, char *, size_t);
                    162: static int      g_lstat(Char *, __gl_stat_t  *, glob_t *);
                    163: static DIR     *g_opendir(Char *, glob_t *);
                    164: static Char    *g_strchr(const Char *, int);
                    165: static int      g_stat(Char *, __gl_stat_t *, glob_t *);
1.23.10.2! riz       166: static int      glob0(const Char *, glob_t *, struct glob_limit *);
        !           167: static int      glob1(Char *, glob_t *, struct glob_limit *);
        !           168: static int      glob2(Char *, Char *, Char *, const Char *, glob_t *,
        !           169:     struct glob_limit *);
        !           170: static int      glob3(Char *, Char *, Char *, const Char *, const Char *,
        !           171:     glob_t *, struct glob_limit *);
        !           172: static int      globextend(const Char *, glob_t *, struct glob_limit *);
1.18      christos  173: static const Char *globtilde(const Char *, Char *, size_t, glob_t *);
1.23.10.2! riz       174: static int      globexp1(const Char *, glob_t *, struct glob_limit *);
1.23.10.1  riz       175: static int      globexp2(const Char *, const Char *, glob_t *, int *,
1.23.10.2! riz       176:     struct glob_limit *);
        !           177: static int      match(const Char *, const Char *, const Char *);
1.12      christos  178: #ifdef DEBUG
1.18      christos  179: static void     qprintf(const char *, Char *);
1.12      christos  180: #endif
                    181:
                    182: int
1.18      christos  183: glob(const char *pattern, int flags, int (*errfunc)(const char *, int),
                    184:     glob_t *pglob)
1.12      christos  185: {
                    186:        const u_char *patnext;
                    187:        int c;
                    188:        Char *bufnext, *bufend, patbuf[MAXPATHLEN+1];
1.23.10.2! riz       189:        struct glob_limit limit = { 0, 0, 0, 0 };
1.12      christos  190:
                    191:        _DIAGASSERT(pattern != NULL);
                    192:
                    193:        patnext = (const u_char *) pattern;
                    194:        if (!(flags & GLOB_APPEND)) {
                    195:                pglob->gl_pathc = 0;
                    196:                pglob->gl_pathv = NULL;
                    197:                if (!(flags & GLOB_DOOFFS))
                    198:                        pglob->gl_offs = 0;
                    199:        }
                    200:        pglob->gl_flags = flags & ~GLOB_MAGCHAR;
                    201:        pglob->gl_errfunc = errfunc;
                    202:        pglob->gl_matchc = 0;
                    203:
                    204:        bufnext = patbuf;
                    205:        bufend = bufnext + MAXPATHLEN;
                    206:        if (flags & GLOB_NOESCAPE) {
                    207:                while (bufnext < bufend && (c = *patnext++) != EOS)
                    208:                        *bufnext++ = c;
                    209:        } else {
                    210:                /* Protect the quoted characters. */
                    211:                while (bufnext < bufend && (c = *patnext++) != EOS)
                    212:                        if (c == QUOTE) {
                    213:                                if ((c = *patnext++) == EOS) {
                    214:                                        c = QUOTE;
                    215:                                        --patnext;
                    216:                                }
                    217:                                *bufnext++ = c | M_PROTECT;
                    218:                        }
                    219:                        else
                    220:                                *bufnext++ = c;
                    221:        }
                    222:        *bufnext = EOS;
                    223:
                    224:        if (flags & GLOB_BRACE)
1.23.10.2! riz       225:            return globexp1(patbuf, pglob, &limit);
1.12      christos  226:        else
1.23.10.2! riz       227:            return glob0(patbuf, pglob, &limit);
1.12      christos  228: }
                    229:
                    230: /*
                    231:  * Expand recursively a glob {} pattern. When there is no more expansion
                    232:  * invoke the standard globbing routine to glob the rest of the magic
                    233:  * characters
                    234:  */
                    235: static int
1.23.10.2! riz       236: globexp1(const Char *pattern, glob_t *pglob, struct glob_limit *limit)
1.12      christos  237: {
                    238:        const Char* ptr = pattern;
                    239:        int rv;
                    240:
                    241:        _DIAGASSERT(pattern != NULL);
                    242:        _DIAGASSERT(pglob != NULL);
                    243:
1.23.10.2! riz       244:        if ((pglob->gl_flags & GLOB_LIMIT) &&
        !           245:            limit->l_brace++ >= GLOB_LIMIT_BRACE) {
        !           246:                errno = 0;
        !           247:                return GLOB_NOSPACE;
        !           248:        }
        !           249:
1.12      christos  250:        /* Protect a single {}, for find(1), like csh */
                    251:        if (pattern[0] == LBRACE && pattern[1] == RBRACE && pattern[2] == EOS)
1.23.10.1  riz       252:                return glob0(pattern, pglob, limit);
1.12      christos  253:
                    254:        while ((ptr = (const Char *) g_strchr(ptr, LBRACE)) != NULL)
1.23.10.1  riz       255:                if (!globexp2(ptr, pattern, pglob, &rv, limit))
1.12      christos  256:                        return rv;
                    257:
1.23.10.1  riz       258:        return glob0(pattern, pglob, limit);
1.12      christos  259: }
                    260:
                    261:
                    262: /*
                    263:  * Recursive brace globbing helper. Tries to expand a single brace.
                    264:  * If it succeeds then it invokes globexp1 with the new pattern.
                    265:  * If it fails then it tries to glob the rest of the pattern and returns.
                    266:  */
                    267: static int
1.23.10.1  riz       268: globexp2(const Char *ptr, const Char *pattern, glob_t *pglob, int *rv,
1.23.10.2! riz       269:     struct glob_limit *limit)
1.12      christos  270: {
                    271:        int     i;
                    272:        Char   *lm, *ls;
                    273:        const Char *pe, *pm, *pl;
                    274:        Char    patbuf[MAXPATHLEN + 1];
                    275:
                    276:        _DIAGASSERT(ptr != NULL);
                    277:        _DIAGASSERT(pattern != NULL);
                    278:        _DIAGASSERT(pglob != NULL);
                    279:        _DIAGASSERT(rv != NULL);
                    280:
                    281:        /* copy part up to the brace */
                    282:        for (lm = patbuf, pm = pattern; pm != ptr; *lm++ = *pm++)
                    283:                continue;
                    284:        ls = lm;
                    285:
                    286:        /* Find the balanced brace */
                    287:        for (i = 0, pe = ++ptr; *pe; pe++)
                    288:                if (*pe == LBRACKET) {
                    289:                        /* Ignore everything between [] */
                    290:                        for (pm = pe++; *pe != RBRACKET && *pe != EOS; pe++)
                    291:                                continue;
                    292:                        if (*pe == EOS) {
                    293:                                /*
                    294:                                 * We could not find a matching RBRACKET.
                    295:                                 * Ignore and just look for RBRACE
                    296:                                 */
                    297:                                pe = pm;
                    298:                        }
                    299:                }
                    300:                else if (*pe == LBRACE)
                    301:                        i++;
                    302:                else if (*pe == RBRACE) {
                    303:                        if (i == 0)
                    304:                                break;
                    305:                        i--;
                    306:                }
                    307:
                    308:        /* Non matching braces; just glob the pattern */
                    309:        if (i != 0 || *pe == EOS) {
                    310:                /*
                    311:                 * we use `pattern', not `patbuf' here so that that
                    312:                 * unbalanced braces are passed to the match
                    313:                 */
1.23.10.1  riz       314:                *rv = glob0(pattern, pglob, limit);
1.12      christos  315:                return 0;
                    316:        }
                    317:
                    318:        for (i = 0, pl = pm = ptr; pm <= pe; pm++) {
                    319:                switch (*pm) {
                    320:                case LBRACKET:
                    321:                        /* Ignore everything between [] */
                    322:                        for (pl = pm++; *pm != RBRACKET && *pm != EOS; pm++)
                    323:                                continue;
                    324:                        if (*pm == EOS) {
                    325:                                /*
                    326:                                 * We could not find a matching RBRACKET.
                    327:                                 * Ignore and just look for RBRACE
                    328:                                 */
                    329:                                pm = pl;
                    330:                        }
                    331:                        break;
                    332:
                    333:                case LBRACE:
                    334:                        i++;
                    335:                        break;
                    336:
                    337:                case RBRACE:
                    338:                        if (i) {
                    339:                                i--;
                    340:                                break;
                    341:                        }
                    342:                        /* FALLTHROUGH */
                    343:                case COMMA:
                    344:                        if (i && *pm == COMMA)
                    345:                                break;
                    346:                        else {
                    347:                                /* Append the current string */
                    348:                                for (lm = ls; (pl < pm); *lm++ = *pl++)
                    349:                                        continue;
                    350:                                /*
                    351:                                 * Append the rest of the pattern after the
                    352:                                 * closing brace
                    353:                                 */
                    354:                                for (pl = pe + 1; (*lm++ = *pl++) != EOS;)
                    355:                                        continue;
                    356:
                    357:                                /* Expand the current pattern */
                    358: #ifdef DEBUG
                    359:                                qprintf("globexp2:", patbuf);
                    360: #endif
1.23.10.1  riz       361:                                *rv = globexp1(patbuf, pglob, limit);
1.12      christos  362:
                    363:                                /* move after the comma, to the next string */
                    364:                                pl = pm + 1;
                    365:                        }
                    366:                        break;
                    367:
                    368:                default:
                    369:                        break;
                    370:                }
                    371:        }
                    372:        *rv = 0;
                    373:        return 0;
                    374: }
                    375:
                    376:
                    377:
                    378: /*
                    379:  * expand tilde from the passwd file.
                    380:  */
                    381: static const Char *
1.18      christos  382: globtilde(const Char *pattern, Char *patbuf, size_t patsize, glob_t *pglob)
1.12      christos  383: {
                    384:        struct passwd *pwd;
                    385:        const char *h;
                    386:        const Char *p;
                    387:        Char *b;
                    388:        char *d;
                    389:        Char *pend = &patbuf[patsize / sizeof(Char)];
                    390: #ifndef NO_GETPW_R
                    391:        struct passwd pwres;
                    392:        char pwbuf[1024];
                    393: #endif
                    394:
                    395:        pend--;
                    396:
                    397:        _DIAGASSERT(pattern != NULL);
                    398:        _DIAGASSERT(patbuf != NULL);
                    399:        _DIAGASSERT(pglob != NULL);
                    400:
                    401:        if (*pattern != TILDE || !(pglob->gl_flags & GLOB_TILDE))
                    402:                return pattern;
                    403:
                    404:        /* Copy up to the end of the string or / */
                    405:        for (p = pattern + 1, d = (char *)(void *)patbuf;
                    406:             d < (char *)(void *)pend && *p && *p != SLASH;
                    407:             *d++ = *p++)
                    408:                continue;
                    409:
                    410:        if (d == (char *)(void *)pend)
                    411:                return NULL;
                    412:
                    413:        *d = EOS;
                    414:        d = (char *)(void *)patbuf;
                    415:
                    416:        if (*d == EOS) {
                    417:                /*
                    418:                 * handle a plain ~ or ~/ by expanding $HOME
                    419:                 * first and then trying the password file
                    420:                 */
                    421:                if ((h = getenv("HOME")) == NULL) {
                    422: #ifdef NO_GETPW_R
                    423:                        if ((pwd = getpwuid(getuid())) == NULL)
                    424: #else
                    425:                        if (getpwuid_r(getuid(), &pwres, pwbuf, sizeof(pwbuf),
                    426:                            &pwd) != 0 || pwd == NULL)
                    427: #endif
                    428:                                return pattern;
                    429:                        else
                    430:                                h = pwd->pw_dir;
                    431:                }
                    432:        }
                    433:        else {
                    434:                /*
                    435:                 * Expand a ~user
                    436:                 */
                    437: #ifdef NO_GETPW_R
                    438:                if ((pwd = getpwnam(d)) == NULL)
                    439: #else
                    440:                if (getpwnam_r(d, &pwres, pwbuf, sizeof(pwbuf), &pwd) != 0 ||
                    441:                    pwd == NULL)
                    442: #endif
                    443:                        return pattern;
                    444:                else
                    445:                        h = pwd->pw_dir;
                    446:        }
                    447:
                    448:        /* Copy the home directory */
                    449:        for (b = patbuf; b < pend && *h; *b++ = *h++)
                    450:                continue;
                    451:
                    452:        if (b == pend)
                    453:                return NULL;
                    454:
                    455:        /* Append the rest of the pattern */
                    456:        while (b < pend && (*b++ = *p++) != EOS)
                    457:                continue;
                    458:
                    459:        if (b == pend)
                    460:                return NULL;
                    461:
                    462:        return patbuf;
                    463: }
                    464:
                    465:
                    466: /*
                    467:  * The main glob() routine: compiles the pattern (optionally processing
                    468:  * quotes), calls glob1() to do the real pattern matching, and finally
                    469:  * sorts the list (unless unsorted operation is requested).  Returns 0
                    470:  * if things went well, nonzero if errors occurred.  It is not an error
                    471:  * to find no matches.
                    472:  */
                    473: static int
1.23.10.2! riz       474: glob0(const Char *pattern, glob_t *pglob, struct glob_limit *limit)
1.12      christos  475: {
                    476:        const Char *qpatnext;
1.16      christos  477:        int c, error;
                    478:        __gl_size_t oldpathc;
1.12      christos  479:        Char *bufnext, patbuf[MAXPATHLEN+1];
                    480:
                    481:        _DIAGASSERT(pattern != NULL);
                    482:        _DIAGASSERT(pglob != NULL);
                    483:
                    484:        if ((qpatnext = globtilde(pattern, patbuf, sizeof(patbuf),
                    485:            pglob)) == NULL)
                    486:                return GLOB_ABEND;
                    487:        oldpathc = pglob->gl_pathc;
                    488:        bufnext = patbuf;
                    489:
                    490:        /* We don't need to check for buffer overflow any more. */
                    491:        while ((c = *qpatnext++) != EOS) {
                    492:                switch (c) {
                    493:                case LBRACKET:
                    494:                        c = *qpatnext;
                    495:                        if (c == NOT)
                    496:                                ++qpatnext;
                    497:                        if (*qpatnext == EOS ||
                    498:                            g_strchr(qpatnext+1, RBRACKET) == NULL) {
                    499:                                *bufnext++ = LBRACKET;
                    500:                                if (c == NOT)
                    501:                                        --qpatnext;
                    502:                                break;
                    503:                        }
                    504:                        *bufnext++ = M_SET;
                    505:                        if (c == NOT)
                    506:                                *bufnext++ = M_NOT;
                    507:                        c = *qpatnext++;
                    508:                        do {
                    509:                                *bufnext++ = CHAR(c);
                    510:                                if (*qpatnext == RANGE &&
                    511:                                    (c = qpatnext[1]) != RBRACKET) {
                    512:                                        *bufnext++ = M_RNG;
                    513:                                        *bufnext++ = CHAR(c);
                    514:                                        qpatnext += 2;
                    515:                                }
                    516:                        } while ((c = *qpatnext++) != RBRACKET);
                    517:                        pglob->gl_flags |= GLOB_MAGCHAR;
                    518:                        *bufnext++ = M_END;
                    519:                        break;
                    520:                case QUESTION:
                    521:                        pglob->gl_flags |= GLOB_MAGCHAR;
                    522:                        *bufnext++ = M_ONE;
                    523:                        break;
                    524:                case STAR:
                    525:                        pglob->gl_flags |= GLOB_MAGCHAR;
                    526:                        /* collapse adjacent stars to one,
                    527:                         * to avoid exponential behavior
                    528:                         */
                    529:                        if (bufnext == patbuf || bufnext[-1] != M_ALL)
                    530:                                *bufnext++ = M_ALL;
                    531:                        break;
                    532:                default:
                    533:                        *bufnext++ = CHAR(c);
                    534:                        break;
                    535:                }
                    536:        }
                    537:        *bufnext = EOS;
                    538: #ifdef DEBUG
                    539:        qprintf("glob0:", patbuf);
                    540: #endif
                    541:
1.23.10.1  riz       542:        if ((error = glob1(patbuf, pglob, limit)) != 0)
1.18      christos  543:                return error;
1.12      christos  544:
                    545:        if (pglob->gl_pathc == oldpathc) {
                    546:                /*
                    547:                 * If there was no match we are going to append the pattern
                    548:                 * if GLOB_NOCHECK was specified or if GLOB_NOMAGIC was
                    549:                 * specified and the pattern did not contain any magic
                    550:                 * characters GLOB_NOMAGIC is there just for compatibility
                    551:                 * with csh.
                    552:                 */
                    553:                if ((pglob->gl_flags & GLOB_NOCHECK) ||
                    554:                    ((pglob->gl_flags & (GLOB_NOMAGIC|GLOB_MAGCHAR))
                    555:                     == GLOB_NOMAGIC)) {
1.23.10.1  riz       556:                        return globextend(pattern, pglob, limit);
1.12      christos  557:                } else {
1.18      christos  558:                        return GLOB_NOMATCH;
1.12      christos  559:                }
                    560:        } else if (!(pglob->gl_flags & GLOB_NOSORT)) {
                    561:                qsort(pglob->gl_pathv + pglob->gl_offs + oldpathc,
                    562:                    (size_t)pglob->gl_pathc - oldpathc, sizeof(char *),
                    563:                    compare);
                    564:        }
                    565:
1.18      christos  566:        return 0;
1.12      christos  567: }
                    568:
                    569: static int
1.18      christos  570: compare(const void *p, const void *q)
1.12      christos  571: {
                    572:
                    573:        _DIAGASSERT(p != NULL);
                    574:        _DIAGASSERT(q != NULL);
                    575:
1.18      christos  576:        return strcoll(*(const char * const *)p, *(const char * const *)q);
1.12      christos  577: }
                    578:
                    579: static int
1.23.10.2! riz       580: glob1(Char *pattern, glob_t *pglob, struct glob_limit *limit)
1.12      christos  581: {
                    582:        Char pathbuf[MAXPATHLEN+1];
                    583:
                    584:        _DIAGASSERT(pattern != NULL);
                    585:        _DIAGASSERT(pglob != NULL);
                    586:
                    587:        /* A null pathname is invalid -- POSIX 1003.1 sect. 2.4. */
                    588:        if (*pattern == EOS)
1.18      christos  589:                return 0;
1.12      christos  590:        /*
                    591:         * we save one character so that we can use ptr >= limit,
                    592:         * in the general case when we are appending non nul chars only.
                    593:         */
1.18      christos  594:        return glob2(pathbuf, pathbuf,
                    595:            pathbuf + (sizeof(pathbuf) / sizeof(*pathbuf)) - 1, pattern,
                    596:            pglob, limit);
1.12      christos  597: }
                    598:
                    599: /*
                    600:  * The functions glob2 and glob3 are mutually recursive; there is one level
                    601:  * of recursion for each segment in the pattern that contains one or more
                    602:  * meta characters.
                    603:  */
                    604: static int
1.23.10.2! riz       605: glob2(Char *pathbuf, Char *pathend, Char *pathlim, const Char *pattern,
        !           606:     glob_t *pglob, struct glob_limit *limit)
1.12      christos  607: {
                    608:        __gl_stat_t sb;
1.23.10.2! riz       609:        const Char *p;
        !           610:        Char *q;
1.12      christos  611:        int anymeta;
1.21      christos  612:        Char *pend;
                    613:        ptrdiff_t diff;
1.12      christos  614:
                    615:        _DIAGASSERT(pathbuf != NULL);
                    616:        _DIAGASSERT(pathend != NULL);
                    617:        _DIAGASSERT(pattern != NULL);
                    618:        _DIAGASSERT(pglob != NULL);
                    619:
                    620:        /*
                    621:         * Loop over pattern segments until end of pattern or until
                    622:         * segment with meta character found.
                    623:         */
                    624:        for (anymeta = 0;;) {
                    625:                if (*pattern == EOS) {          /* End of pattern? */
                    626:                        *pathend = EOS;
                    627:                        if (g_lstat(pathbuf, &sb, pglob))
1.18      christos  628:                                return 0;
1.12      christos  629:
1.23.10.1  riz       630:                        if ((pglob->gl_flags & GLOB_LIMIT) &&
1.23.10.2! riz       631:                            limit->l_stat++ >= GLOB_LIMIT_STAT) {
1.23.10.1  riz       632:                                errno = 0;
                    633:                                *pathend++ = SEP;
                    634:                                *pathend = EOS;
                    635:                                return GLOB_NOSPACE;
                    636:                        }
1.12      christos  637:                        if (((pglob->gl_flags & GLOB_MARK) &&
                    638:                            pathend[-1] != SEP) && (S_ISDIR(sb.st_mode) ||
                    639:                            (S_ISLNK(sb.st_mode) &&
                    640:                            (g_stat(pathbuf, &sb, pglob) == 0) &&
                    641:                            S_ISDIR(sb.st_mode)))) {
                    642:                                if (pathend >= pathlim)
1.18      christos  643:                                        return GLOB_ABORTED;
1.12      christos  644:                                *pathend++ = SEP;
                    645:                                *pathend = EOS;
                    646:                        }
                    647:                        ++pglob->gl_matchc;
1.18      christos  648:                        return globextend(pathbuf, pglob, limit);
1.12      christos  649:                }
                    650:
                    651:                /* Find end of next segment, copy tentatively to pathend. */
                    652:                q = pathend;
                    653:                p = pattern;
                    654:                while (*p != EOS && *p != SEP) {
                    655:                        if (ismeta(*p))
                    656:                                anymeta = 1;
                    657:                        if (q >= pathlim)
                    658:                                return GLOB_ABORTED;
                    659:                        *q++ = *p++;
                    660:                }
                    661:
1.20      christos  662:                 /*
1.21      christos  663:                 * No expansion, or path ends in slash-dot shash-dot-dot,
1.20      christos  664:                 * do next segment.
                    665:                 */
1.21      christos  666:                if (pglob->gl_flags & GLOB_PERIOD) {
                    667:                        for (pend = pathend; pend > pathbuf && pend[-1] == '/';
                    668:                            pend--)
                    669:                                continue;
                    670:                        diff = pend - pathbuf;
                    671:                } else {
                    672:                        /* XXX: GCC */
                    673:                        diff = 0;
                    674:                        pend = pathend;
                    675:                }
                    676:
                    677:                 if ((!anymeta) ||
                    678:                    ((pglob->gl_flags & GLOB_PERIOD) &&
                    679:                     (diff >= 1 && pend[-1] == DOT) &&
                    680:                     (diff >= 2 && (pend[-2] == SLASH || pend[-2] == DOT)) &&
                    681:                     (diff < 3 || pend[-3] == SLASH))) {
1.12      christos  682:                        pathend = q;
                    683:                        pattern = p;
                    684:                        while (*pattern == SEP) {
                    685:                                if (pathend >= pathlim)
                    686:                                        return GLOB_ABORTED;
                    687:                                *pathend++ = *pattern++;
                    688:                        }
                    689:                } else                  /* Need expansion, recurse. */
1.18      christos  690:                        return glob3(pathbuf, pathend, pathlim, pattern, p,
                    691:                            pglob, limit);
1.12      christos  692:        }
                    693:        /* NOTREACHED */
                    694: }
                    695:
                    696: static int
1.23.10.2! riz       697: glob3(Char *pathbuf, Char *pathend, Char *pathlim, const Char *pattern,
        !           698:     const Char *restpattern, glob_t *pglob, struct glob_limit *limit)
1.12      christos  699: {
                    700:        struct dirent *dp;
                    701:        DIR *dirp;
                    702:        int error;
                    703:        char buf[MAXPATHLEN];
                    704:
                    705:        /*
                    706:         * The readdirfunc declaration can't be prototyped, because it is
                    707:         * assigned, below, to two functions which are prototyped in glob.h
                    708:         * and dirent.h as taking pointers to differently typed opaque
                    709:         * structures.
                    710:         */
1.18      christos  711:        struct dirent *(*readdirfunc)(void *);
1.12      christos  712:
                    713:        _DIAGASSERT(pathbuf != NULL);
                    714:        _DIAGASSERT(pathend != NULL);
                    715:        _DIAGASSERT(pattern != NULL);
                    716:        _DIAGASSERT(restpattern != NULL);
                    717:        _DIAGASSERT(pglob != NULL);
                    718:
                    719:        *pathend = EOS;
                    720:        errno = 0;
                    721:
                    722:        if ((dirp = g_opendir(pathbuf, pglob)) == NULL) {
                    723:                if (pglob->gl_errfunc) {
                    724:                        if (g_Ctoc(pathbuf, buf, sizeof(buf)))
1.18      christos  725:                                return GLOB_ABORTED;
1.12      christos  726:                        if (pglob->gl_errfunc(buf, errno) ||
                    727:                            pglob->gl_flags & GLOB_ERR)
1.18      christos  728:                                return GLOB_ABORTED;
1.12      christos  729:                }
                    730:                /*
                    731:                 * Posix/XOpen: glob should return when it encounters a
                    732:                 * directory that it cannot open or read
                    733:                 * XXX: Should we ignore ENOTDIR and ENOENT though?
                    734:                 * I think that Posix had in mind EPERM...
                    735:                 */
                    736:                if (pglob->gl_flags & GLOB_ERR)
1.18      christos  737:                        return GLOB_ABORTED;
1.12      christos  738:
1.18      christos  739:                return 0;
1.12      christos  740:        }
                    741:
                    742:        error = 0;
                    743:
                    744:        /* Search directory for matching names. */
                    745:        if (pglob->gl_flags & GLOB_ALTDIRFUNC)
                    746:                readdirfunc = pglob->gl_readdir;
                    747:        else
                    748:                readdirfunc = (struct dirent *(*)__P((void *))) readdir;
                    749:        while ((dp = (*readdirfunc)(dirp)) != NULL) {
                    750:                u_char *sc;
                    751:                Char *dc;
                    752:
1.23.10.1  riz       753:                if ((pglob->gl_flags & GLOB_LIMIT) &&
1.23.10.2! riz       754:                    limit->l_readdir++ >= GLOB_LIMIT_READDIR) {
1.23.10.1  riz       755:                        errno = 0;
                    756:                        *pathend++ = SEP;
                    757:                        *pathend = EOS;
                    758:                        return GLOB_NOSPACE;
                    759:                }
                    760:
1.19      christos  761:                /*
                    762:                 * Initial DOT must be matched literally, unless we have
                    763:                 * GLOB_PERIOD set.
                    764:                 */
                    765:                if ((pglob->gl_flags & GLOB_PERIOD) == 0)
                    766:                        if (dp->d_name[0] == DOT && *pattern != DOT)
                    767:                                continue;
1.12      christos  768:                /*
1.22      christos  769:                 * If GLOB_NO_DOTDIRS is set, . and .. vanish.
                    770:                 */
                    771:                if ((pglob->gl_flags & GLOB_NO_DOTDIRS) &&
                    772:                    (dp->d_name[0] == DOT) &&
                    773:                    ((dp->d_name[1] == EOS) ||
                    774:                     ((dp->d_name[1] == DOT) && (dp->d_name[2] == EOS))))
                    775:                        continue;
                    776:                /*
1.12      christos  777:                 * The resulting string contains EOS, so we can
                    778:                 * use the pathlim character, if it is the nul
                    779:                 */
                    780:                for (sc = (u_char *) dp->d_name, dc = pathend;
                    781:                     dc <= pathlim && (*dc++ = *sc++) != EOS;)
                    782:                        continue;
                    783:
                    784:                /*
                    785:                 * Have we filled the buffer without seeing EOS?
                    786:                 */
                    787:                if (dc > pathlim && *pathlim != EOS) {
                    788:                        /*
                    789:                         * Abort when requested by caller, otherwise
                    790:                         * reset pathend back to last SEP and continue
                    791:                         * with next dir entry.
                    792:                         */
                    793:                        if (pglob->gl_flags & GLOB_ERR) {
                    794:                                error = GLOB_ABORTED;
                    795:                                break;
                    796:                        }
                    797:                        else {
                    798:                                *pathend = EOS;
                    799:                                continue;
                    800:                        }
                    801:                }
                    802:
                    803:                if (!match(pathend, pattern, restpattern)) {
                    804:                        *pathend = EOS;
                    805:                        continue;
                    806:                }
1.23.10.1  riz       807:                error = glob2(pathbuf, --dc, pathlim, restpattern, pglob,
                    808:                    limit);
1.12      christos  809:                if (error)
                    810:                        break;
                    811:        }
                    812:
                    813:        if (pglob->gl_flags & GLOB_ALTDIRFUNC)
                    814:                (*pglob->gl_closedir)(dirp);
                    815:        else
                    816:                closedir(dirp);
                    817:
                    818:        /*
                    819:         * Again Posix X/Open issue with regards to error handling.
                    820:         */
                    821:        if ((error || errno) && (pglob->gl_flags & GLOB_ERR))
1.18      christos  822:                return GLOB_ABORTED;
1.12      christos  823:
1.18      christos  824:        return error;
1.12      christos  825: }
                    826:
                    827:
                    828: /*
1.17      christos  829:  * Extend the gl_pathv member of a glob_t structure to accommodate a new item,
1.12      christos  830:  * add the new item, and update gl_pathc.
                    831:  *
                    832:  * This assumes the BSD realloc, which only copies the block when its size
                    833:  * crosses a power-of-two boundary; for v7 realloc, this would cause quadratic
                    834:  * behavior.
                    835:  *
                    836:  * Return 0 if new item added, error code if memory couldn't be allocated.
                    837:  *
                    838:  * Invariant of the glob_t structure:
                    839:  *     Either gl_pathc is zero and gl_pathv is NULL; or gl_pathc > 0 and
                    840:  *     gl_pathv points to (gl_offs + gl_pathc + 1) items.
                    841:  */
                    842: static int
1.23.10.2! riz       843: globextend(const Char *path, glob_t *pglob, struct glob_limit *limit)
1.12      christos  844: {
                    845:        char **pathv;
1.16      christos  846:        size_t i, newsize, len;
1.12      christos  847:        char *copy;
                    848:        const Char *p;
                    849:
                    850:        _DIAGASSERT(path != NULL);
                    851:        _DIAGASSERT(pglob != NULL);
                    852:
                    853:        newsize = sizeof(*pathv) * (2 + pglob->gl_pathc + pglob->gl_offs);
1.23.10.2! riz       854:        if ((pglob->gl_flags & GLOB_LIMIT) &&
        !           855:            newsize > GLOB_LIMIT_PATH * sizeof(*pathv))
        !           856:                goto nospace;
1.12      christos  857:        pathv = pglob->gl_pathv ? realloc(pglob->gl_pathv, newsize) :
                    858:            malloc(newsize);
                    859:        if (pathv == NULL)
1.18      christos  860:                return GLOB_NOSPACE;
1.12      christos  861:
                    862:        if (pglob->gl_pathv == NULL && pglob->gl_offs > 0) {
                    863:                /* first time around -- clear initial gl_offs items */
                    864:                pathv += pglob->gl_offs;
1.16      christos  865:                for (i = pglob->gl_offs + 1; --i > 0; )
1.12      christos  866:                        *--pathv = NULL;
                    867:        }
                    868:        pglob->gl_pathv = pathv;
                    869:
                    870:        for (p = path; *p++;)
                    871:                continue;
                    872:        len = (size_t)(p - path);
1.23.10.2! riz       873:        limit->l_string += len;
1.12      christos  874:        if ((copy = malloc(len)) != NULL) {
                    875:                if (g_Ctoc(path, copy, len)) {
                    876:                        free(copy);
1.18      christos  877:                        return GLOB_ABORTED;
1.12      christos  878:                }
                    879:                pathv[pglob->gl_offs + pglob->gl_pathc++] = copy;
                    880:        }
                    881:        pathv[pglob->gl_offs + pglob->gl_pathc] = NULL;
                    882:
1.23.10.1  riz       883:        if ((pglob->gl_flags & GLOB_LIMIT) &&
1.23.10.2! riz       884:            (newsize + limit->l_string) >= GLOB_LIMIT_STRING)
        !           885:                goto nospace;
1.12      christos  886:
1.18      christos  887:        return copy == NULL ? GLOB_NOSPACE : 0;
1.23.10.2! riz       888: nospace:
        !           889:        errno = 0;
        !           890:        return GLOB_NOSPACE;
1.12      christos  891: }
                    892:
                    893:
                    894: /*
                    895:  * pattern matching function for filenames.  Each occurrence of the *
                    896:  * pattern causes a recursion level.
                    897:  */
                    898: static int
1.23.10.2! riz       899: match(const Char *name, const Char *pat, const Char *patend)
1.12      christos  900: {
                    901:        int ok, negate_range;
                    902:        Char c, k;
                    903:
                    904:        _DIAGASSERT(name != NULL);
                    905:        _DIAGASSERT(pat != NULL);
                    906:        _DIAGASSERT(patend != NULL);
                    907:
                    908:        while (pat < patend) {
                    909:                c = *pat++;
                    910:                switch (c & M_MASK) {
                    911:                case M_ALL:
                    912:                        if (pat == patend)
1.18      christos  913:                                return 1;
1.12      christos  914:                        do
                    915:                            if (match(name, pat, patend))
1.18      christos  916:                                    return 1;
1.12      christos  917:                        while (*name++ != EOS);
1.18      christos  918:                        return 0;
1.12      christos  919:                case M_ONE:
                    920:                        if (*name++ == EOS)
1.18      christos  921:                                return 0;
1.12      christos  922:                        break;
                    923:                case M_SET:
                    924:                        ok = 0;
                    925:                        if ((k = *name++) == EOS)
1.18      christos  926:                                return 0;
1.12      christos  927:                        if ((negate_range = ((*pat & M_MASK) == M_NOT)) != EOS)
                    928:                                ++pat;
                    929:                        while (((c = *pat++) & M_MASK) != M_END)
                    930:                                if ((*pat & M_MASK) == M_RNG) {
                    931:                                        if (c <= k && k <= pat[1])
                    932:                                                ok = 1;
                    933:                                        pat += 2;
                    934:                                } else if (c == k)
                    935:                                        ok = 1;
                    936:                        if (ok == negate_range)
1.18      christos  937:                                return 0;
1.12      christos  938:                        break;
                    939:                default:
                    940:                        if (*name++ != c)
1.18      christos  941:                                return 0;
1.12      christos  942:                        break;
                    943:                }
                    944:        }
1.18      christos  945:        return *name == EOS;
1.12      christos  946: }
                    947:
                    948: /* Free allocated data belonging to a glob_t structure. */
                    949: void
1.18      christos  950: globfree(glob_t *pglob)
1.12      christos  951: {
1.16      christos  952:        size_t i;
1.12      christos  953:        char **pp;
                    954:
                    955:        _DIAGASSERT(pglob != NULL);
                    956:
                    957:        if (pglob->gl_pathv != NULL) {
                    958:                pp = pglob->gl_pathv + pglob->gl_offs;
                    959:                for (i = pglob->gl_pathc; i--; ++pp)
                    960:                        if (*pp)
                    961:                                free(*pp);
                    962:                free(pglob->gl_pathv);
                    963:                pglob->gl_pathv = NULL;
                    964:                pglob->gl_pathc = 0;
                    965:        }
                    966: }
                    967:
                    968: static DIR *
1.18      christos  969: g_opendir(Char *str, glob_t *pglob)
1.12      christos  970: {
                    971:        char buf[MAXPATHLEN];
                    972:
                    973:        _DIAGASSERT(str != NULL);
                    974:        _DIAGASSERT(pglob != NULL);
                    975:
                    976:        if (!*str)
                    977:                (void)strlcpy(buf, ".", sizeof(buf));
                    978:        else {
                    979:                if (g_Ctoc(str, buf, sizeof(buf)))
                    980:                        return NULL;
                    981:        }
                    982:
                    983:        if (pglob->gl_flags & GLOB_ALTDIRFUNC)
1.18      christos  984:                return (*pglob->gl_opendir)(buf);
1.12      christos  985:
1.18      christos  986:        return opendir(buf);
1.12      christos  987: }
                    988:
                    989: static int
1.18      christos  990: g_lstat(Char *fn, __gl_stat_t *sb, glob_t *pglob)
1.12      christos  991: {
                    992:        char buf[MAXPATHLEN];
                    993:
                    994:        _DIAGASSERT(fn != NULL);
                    995:        _DIAGASSERT(sb != NULL);
                    996:        _DIAGASSERT(pglob != NULL);
                    997:
                    998:        if (g_Ctoc(fn, buf, sizeof(buf)))
                    999:                return -1;
                   1000:        if (pglob->gl_flags & GLOB_ALTDIRFUNC)
1.18      christos 1001:                return (*pglob->gl_lstat)(buf, sb);
                   1002:        return lstat(buf, sb);
1.12      christos 1003: }
                   1004:
                   1005: static int
1.18      christos 1006: g_stat(Char *fn, __gl_stat_t *sb, glob_t *pglob)
1.12      christos 1007: {
                   1008:        char buf[MAXPATHLEN];
                   1009:
                   1010:        _DIAGASSERT(fn != NULL);
                   1011:        _DIAGASSERT(sb != NULL);
                   1012:        _DIAGASSERT(pglob != NULL);
                   1013:
                   1014:        if (g_Ctoc(fn, buf, sizeof(buf)))
                   1015:                return -1;
                   1016:        if (pglob->gl_flags & GLOB_ALTDIRFUNC)
1.18      christos 1017:                return (*pglob->gl_stat)(buf, sb);
                   1018:        return stat(buf, sb);
1.12      christos 1019: }
                   1020:
                   1021: static Char *
1.18      christos 1022: g_strchr(const Char *str, int ch)
1.12      christos 1023: {
                   1024:
                   1025:        _DIAGASSERT(str != NULL);
                   1026:
                   1027:        do {
                   1028:                if (*str == ch)
1.14      christos 1029:                        return __UNCONST(str);
1.12      christos 1030:        } while (*str++);
                   1031:        return NULL;
                   1032: }
                   1033:
                   1034: static int
1.18      christos 1035: g_Ctoc(const Char *str, char *buf, size_t len)
1.12      christos 1036: {
                   1037:        char *dc;
                   1038:
                   1039:        _DIAGASSERT(str != NULL);
                   1040:        _DIAGASSERT(buf != NULL);
                   1041:
                   1042:        if (len == 0)
                   1043:                return 1;
                   1044:
                   1045:        for (dc = buf; len && (*dc++ = *str++) != EOS; len--)
                   1046:                continue;
                   1047:
                   1048:        return len == 0;
                   1049: }
                   1050:
                   1051: #ifdef DEBUG
                   1052: static void
1.18      christos 1053: qprintf(const char *str, Char *s)
1.12      christos 1054: {
                   1055:        Char *p;
                   1056:
                   1057:        _DIAGASSERT(str != NULL);
                   1058:        _DIAGASSERT(s != NULL);
                   1059:
                   1060:        (void)printf("%s:\n", str);
                   1061:        for (p = s; *p; p++)
                   1062:                (void)printf("%c", CHAR(*p));
                   1063:        (void)printf("\n");
                   1064:        for (p = s; *p; p++)
                   1065:                (void)printf("%c", *p & M_PROTECT ? '"' : ' ');
                   1066:        (void)printf("\n");
                   1067:        for (p = s; *p; p++)
                   1068:                (void)printf("%c", ismeta(*p) ? '_' : ' ');
                   1069:        (void)printf("\n");
                   1070: }
                   1071: #endif

CVSweb <webmaster@jp.NetBSD.org>