[BACK]Return to ip_input.c CVS log [TXT][DIR] Up to [cvs.NetBSD.org] / src / sys / netinet

Please note that diffs are not public domain; they are subject to the copyright notices on the relevant files.

Diff for /src/sys/netinet/ip_input.c between version 1.130.2.16 and 1.131

version 1.130.2.16, 2002/12/11 06:46:37 version 1.131, 2001/03/27 02:24:38
Line 3 
Line 3 
 /*  /*
  * Copyright (C) 1995, 1996, 1997, and 1998 WIDE Project.   * Copyright (C) 1995, 1996, 1997, and 1998 WIDE Project.
  * All rights reserved.   * All rights reserved.
  *   *
  * Redistribution and use in source and binary forms, with or without   * Redistribution and use in source and binary forms, with or without
  * modification, are permitted provided that the following conditions   * modification, are permitted provided that the following conditions
  * are met:   * are met:
Line 15 
Line 15 
  * 3. Neither the name of the project nor the names of its contributors   * 3. Neither the name of the project nor the names of its contributors
  *    may be used to endorse or promote products derived from this software   *    may be used to endorse or promote products derived from this software
  *    without specific prior written permission.   *    without specific prior written permission.
  *   *
  * THIS SOFTWARE IS PROVIDED BY THE PROJECT AND CONTRIBUTORS ``AS IS'' AND   * THIS SOFTWARE IS PROVIDED BY THE PROJECT AND CONTRIBUTORS ``AS IS'' AND
  * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE   * ANY EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
  * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE   * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR PURPOSE
Line 101 
Line 101 
  *      @(#)ip_input.c  8.2 (Berkeley) 1/4/94   *      @(#)ip_input.c  8.2 (Berkeley) 1/4/94
  */   */
   
 #include <sys/cdefs.h>  
 __KERNEL_RCSID(0, "$NetBSD$");  
   
 #include "opt_gateway.h"  #include "opt_gateway.h"
 #include "opt_pfil_hooks.h"  #include "opt_pfil_hooks.h"
 #include "opt_ipsec.h"  #include "opt_ipsec.h"
 #include "opt_mrouting.h"  #include "opt_mrouting.h"
 #include "opt_inet_csum.h"  
   
 #include <sys/param.h>  #include <sys/param.h>
 #include <sys/systm.h>  #include <sys/systm.h>
Line 121  __KERNEL_RCSID(0, "$NetBSD$");
Line 117  __KERNEL_RCSID(0, "$NetBSD$");
 #include <sys/errno.h>  #include <sys/errno.h>
 #include <sys/time.h>  #include <sys/time.h>
 #include <sys/kernel.h>  #include <sys/kernel.h>
   #include <sys/proc.h>
 #include <sys/pool.h>  #include <sys/pool.h>
   
   #include <uvm/uvm_extern.h>
   
 #include <sys/sysctl.h>  #include <sys/sysctl.h>
   
 #include <net/if.h>  #include <net/if.h>
Line 139  __KERNEL_RCSID(0, "$NetBSD$");
Line 139  __KERNEL_RCSID(0, "$NetBSD$");
 /* just for gif_ttl */  /* just for gif_ttl */
 #include <netinet/in_gif.h>  #include <netinet/in_gif.h>
 #include "gif.h"  #include "gif.h"
 #include <net/if_gre.h>  
 #include "gre.h"  
   
 #ifdef MROUTING  #ifdef MROUTING
 #include <netinet/ip_mroute.h>  #include <netinet/ip_mroute.h>
Line 168  __KERNEL_RCSID(0, "$NetBSD$");
Line 166  __KERNEL_RCSID(0, "$NetBSD$");
 #define IPALLOWSRCRT    1       /* allow source-routed packets */  #define IPALLOWSRCRT    1       /* allow source-routed packets */
 #endif  #endif
 #ifndef IPMTUDISC  #ifndef IPMTUDISC
 #define IPMTUDISC       1  #define IPMTUDISC       0
 #endif  #endif
 #ifndef IPMTUDISCTIMEOUT  #ifndef IPMTUDISCTIMEOUT
 #define IPMTUDISCTIMEOUT (10 * 60)      /* as per RFC 1191 */  #define IPMTUDISCTIMEOUT (10 * 60)      /* as per RFC 1191 */
Line 192  int ip_forwsrcrt = IPFORWSRCRT;
Line 190  int ip_forwsrcrt = IPFORWSRCRT;
 int     ip_directedbcast = IPDIRECTEDBCAST;  int     ip_directedbcast = IPDIRECTEDBCAST;
 int     ip_allowsrcrt = IPALLOWSRCRT;  int     ip_allowsrcrt = IPALLOWSRCRT;
 int     ip_mtudisc = IPMTUDISC;  int     ip_mtudisc = IPMTUDISC;
 int     ip_mtudisc_timeout = IPMTUDISCTIMEOUT;  u_int   ip_mtudisc_timeout = IPMTUDISCTIMEOUT;
 #ifdef DIAGNOSTIC  #ifdef DIAGNOSTIC
 int     ipprintfs = 0;  int     ipprintfs = 0;
 #endif  #endif
Line 201  struct rttimer_queue *ip_mtudisc_timeout
Line 199  struct rttimer_queue *ip_mtudisc_timeout
   
 extern  struct domain inetdomain;  extern  struct domain inetdomain;
 int     ipqmaxlen = IFQ_MAXLEN;  int     ipqmaxlen = IFQ_MAXLEN;
 u_long  in_ifaddrhash;                          /* size of hash table - 1 */  
 int     in_ifaddrentries;                       /* total number of addrs */  
 struct  in_ifaddrhead in_ifaddr;  struct  in_ifaddrhead in_ifaddr;
 struct  in_ifaddrhashhead *in_ifaddrhashtbl;  struct  in_ifaddrhashhead *in_ifaddrhashtbl;
 struct  ifqueue ipintrq;  struct  ifqueue ipintrq;
Line 216  struct pfil_head inet_pfil_hook;
Line 212  struct pfil_head inet_pfil_hook;
 struct ipqhead ipq;  struct ipqhead ipq;
 int     ipq_locked;  int     ipq_locked;
 int     ip_nfragpackets = 0;  int     ip_nfragpackets = 0;
 int     ip_maxfragpackets = 200;  int     ip_maxfragpackets = -1;
   
 static __inline int ipq_lock_try __P((void));  static __inline int ipq_lock_try __P((void));
 static __inline void ipq_unlock __P((void));  static __inline void ipq_unlock __P((void));
Line 226  ipq_lock_try()
Line 222  ipq_lock_try()
 {  {
         int s;          int s;
   
         /*          s = splimp();
          * Use splvm() -- we're blocking things that would cause  
          * mbuf allocation.  
          */  
         s = splvm();  
         if (ipq_locked) {          if (ipq_locked) {
                 splx(s);                  splx(s);
                 return (0);                  return (0);
Line 245  ipq_unlock()
Line 237  ipq_unlock()
 {  {
         int s;          int s;
   
         s = splvm();          s = splimp();
         ipq_locked = 0;          ipq_locked = 0;
         splx(s);          splx(s);
 }  }
Line 257  do {         \
Line 249  do {         \
                 printf("%s:%d: ipq already locked\n", __FILE__, __LINE__); \                  printf("%s:%d: ipq already locked\n", __FILE__, __LINE__); \
                 panic("ipq_lock");                                      \                  panic("ipq_lock");                                      \
         }                                                               \          }                                                               \
 } while (/*CONSTCOND*/ 0)  } while (0)
 #define IPQ_LOCK_CHECK()                                                \  #define IPQ_LOCK_CHECK()                                                \
 do {                                                                    \  do {                                                                    \
         if (ipq_locked == 0) {                                          \          if (ipq_locked == 0) {                                          \
                 printf("%s:%d: ipq lock not held\n", __FILE__, __LINE__); \                  printf("%s:%d: ipq lock not held\n", __FILE__, __LINE__); \
                 panic("ipq lock check");                                \                  panic("ipq lock check");                                \
         }                                                               \          }                                                               \
 } while (/*CONSTCOND*/ 0)  } while (0)
 #else  #else
 #define IPQ_LOCK()              (void) ipq_lock_try()  #define IPQ_LOCK()              (void) ipq_lock_try()
 #define IPQ_LOCK_CHECK()        /* nothing */  #define IPQ_LOCK_CHECK()        /* nothing */
Line 274  do {         \
Line 266  do {         \
   
 struct pool ipqent_pool;  struct pool ipqent_pool;
   
 #ifdef INET_CSUM_COUNTERS  
 #include <sys/device.h>  
   
 struct evcnt ip_hwcsum_bad = EVCNT_INITIALIZER(EVCNT_TYPE_MISC,  
     NULL, "inet", "hwcsum bad");  
 struct evcnt ip_hwcsum_ok = EVCNT_INITIALIZER(EVCNT_TYPE_MISC,  
     NULL, "inet", "hwcsum ok");  
 struct evcnt ip_swcsum = EVCNT_INITIALIZER(EVCNT_TYPE_MISC,  
     NULL, "inet", "swcsum");  
   
 #define INET_CSUM_COUNTER_INCR(ev)      (ev)->ev_count++  
   
 #else  
   
 #define INET_CSUM_COUNTER_INCR(ev)      /* nothing */  
   
 #endif /* INET_CSUM_COUNTERS */  
   
 /*  /*
  * We need to save the IP options in case a protocol wants to respond   * We need to save the IP options in case a protocol wants to respond
  * to an incoming packet over the same route if the packet got here   * to an incoming packet over the same route if the packet got here
Line 320  ip_init()
Line 294  ip_init()
         int i;          int i;
   
         pool_init(&ipqent_pool, sizeof(struct ipqent), 0, 0, 0, "ipqepl",          pool_init(&ipqent_pool, sizeof(struct ipqent), 0, 0, 0, "ipqepl",
             NULL);              0, NULL, NULL, M_IPQ);
   
         pr = pffindproto(PF_INET, IPPROTO_RAW, SOCK_RAW);          pr = pffindproto(PF_INET, IPPROTO_RAW, SOCK_RAW);
         if (pr == 0)          if (pr == 0)
Line 338  ip_init()
Line 312  ip_init()
         TAILQ_INIT(&in_ifaddr);          TAILQ_INIT(&in_ifaddr);
         in_ifaddrhashtbl = hashinit(IN_IFADDR_HASH_SIZE, HASH_LIST, M_IFADDR,          in_ifaddrhashtbl = hashinit(IN_IFADDR_HASH_SIZE, HASH_LIST, M_IFADDR,
             M_WAITOK, &in_ifaddrhash);              M_WAITOK, &in_ifaddrhash);
         ip_mtudisc_timeout_q = rt_timer_queue_create(ip_mtudisc_timeout);          if (ip_mtudisc != 0)
                   ip_mtudisc_timeout_q =
                       rt_timer_queue_create(ip_mtudisc_timeout);
 #ifdef GATEWAY  #ifdef GATEWAY
         ipflow_init();          ipflow_init();
 #endif  #endif
Line 352  ip_init()
Line 328  ip_init()
                 printf("ip_init: WARNING: unable to register pfil hook, "                  printf("ip_init: WARNING: unable to register pfil hook, "
                     "error %d\n", i);                      "error %d\n", i);
 #endif /* PFIL_HOOKS */  #endif /* PFIL_HOOKS */
   
 #ifdef INET_CSUM_COUNTERS  
         evcnt_attach_static(&ip_hwcsum_bad);  
         evcnt_attach_static(&ip_hwcsum_ok);  
         evcnt_attach_static(&ip_swcsum);  
 #endif /* INET_CSUM_COUNTERS */  
 }  }
   
 struct  sockaddr_in ipaddr = { sizeof(ipaddr), AF_INET };  struct  sockaddr_in ipaddr = { sizeof(ipaddr), AF_INET };
Line 373  ipintr()
Line 343  ipintr()
         struct mbuf *m;          struct mbuf *m;
   
         while (1) {          while (1) {
                 s = splnet();                  s = splimp();
                 IF_DEQUEUE(&ipintrq, m);                  IF_DEQUEUE(&ipintrq, m);
                 splx(s);                  splx(s);
                 if (m == 0)                  if (m == 0)
Line 415  ip_input(struct mbuf *m)
Line 385  ip_input(struct mbuf *m)
          * If no IP addresses have been set yet but the interfaces           * If no IP addresses have been set yet but the interfaces
          * are receiving, can't do anything with incoming packets yet.           * are receiving, can't do anything with incoming packets yet.
          */           */
         if (TAILQ_FIRST(&in_ifaddr) == 0)          if (in_ifaddr.tqh_first == 0)
                 goto bad;                  goto bad;
         ipstat.ips_total++;          ipstat.ips_total++;
         /*          if (m->m_len < sizeof (struct ip) &&
          * If the IP header is not aligned, slurp it up into a new              (m = m_pullup(m, sizeof (struct ip))) == 0) {
          * mbuf with space for link headers, in the event we forward                  ipstat.ips_toosmall++;
          * it.  Otherwise, if it is aligned, make sure the entire                  return;
          * base IP header is in the first mbuf of the chain.  
          */  
         if (IP_HDR_ALIGNED_P(mtod(m, caddr_t)) == 0) {  
                 if ((m = m_copyup(m, sizeof(struct ip),  
                                   (max_linkhdr + 3) & ~3)) == NULL) {  
                         /* XXXJRT new stat, please */  
                         ipstat.ips_toosmall++;  
                         return;  
                 }  
         } else if (__predict_false(m->m_len < sizeof (struct ip))) {  
                 if ((m = m_pullup(m, sizeof (struct ip))) == NULL) {  
                         ipstat.ips_toosmall++;  
                         return;  
                 }  
         }          }
         ip = mtod(m, struct ip *);          ip = mtod(m, struct ip *);
         if (ip->ip_v != IPVERSION) {          if (ip->ip_v != IPVERSION) {
Line 473  ip_input(struct mbuf *m)
Line 429  ip_input(struct mbuf *m)
                 }                  }
         }          }
   
         switch (m->m_pkthdr.csum_flags &          if (in_cksum(m, hlen) != 0) {
                 ((m->m_pkthdr.rcvif->if_csum_flags_rx & M_CSUM_IPv4) |                  ipstat.ips_badsum++;
                  M_CSUM_IPv4_BAD)) {                  goto bad;
         case M_CSUM_IPv4|M_CSUM_IPv4_BAD:  
                 INET_CSUM_COUNTER_INCR(&ip_hwcsum_bad);  
                 goto badcsum;  
   
         case M_CSUM_IPv4:  
                 /* Checksum was okay. */  
                 INET_CSUM_COUNTER_INCR(&ip_hwcsum_ok);  
                 break;  
   
         default:  
                 /* Must compute it ourselves. */  
                 INET_CSUM_COUNTER_INCR(&ip_swcsum);  
                 if (in_cksum(m, hlen) != 0)  
                         goto bad;  
                 break;  
         }          }
   
         /* Retrieve the packet length. */          /* Retrieve the packet length. */
Line 523  ip_input(struct mbuf *m)
Line 464  ip_input(struct mbuf *m)
         }          }
   
 #ifdef IPSEC  #ifdef IPSEC
         /* ipflow (IP fast forwarding) is not compatible with IPsec. */          /* ipflow (IP fast fowarding) is not compatible with IPsec. */
         m->m_flags &= ~M_CANFASTFWD;          m->m_flags &= ~M_CANFASTFWD;
 #else  #else
         /*          /*
Line 546  ip_input(struct mbuf *m)
Line 487  ip_input(struct mbuf *m)
          * not the decapsulated packet.           * not the decapsulated packet.
          */           */
 #ifdef IPSEC  #ifdef IPSEC
         if (!ipsec_getnhist(m))          if (!ipsec_gethist(m, NULL))
 #else  #else
         if (1)          if (1)
 #endif  #endif
Line 557  ip_input(struct mbuf *m)
Line 498  ip_input(struct mbuf *m)
                 if (m == NULL)                  if (m == NULL)
                         return;                          return;
                 ip = mtod(m, struct ip *);                  ip = mtod(m, struct ip *);
                 hlen = ip->ip_hl << 2;  
         }          }
 #endif /* PFIL_HOOKS */  #endif /* PFIL_HOOKS */
   
Line 570  ip_input(struct mbuf *m)
Line 510  ip_input(struct mbuf *m)
 #endif  #endif
   
         /*          /*
            * Convert fields to host representation.
            */
           NTOHS(ip->ip_len);
           NTOHS(ip->ip_off);
   
           /*
          * Process options and, if not destined for us,           * Process options and, if not destined for us,
          * ship it on.  ip_dooptions returns 1 when an           * ship it on.  ip_dooptions returns 1 when an
          * error was detected (causing an icmp message           * error was detected (causing an icmp message
Line 587  ip_input(struct mbuf *m)
Line 533  ip_input(struct mbuf *m)
          * as not mine.           * as not mine.
          */           */
         downmatch = 0;          downmatch = 0;
         LIST_FOREACH(ia, &IN_IFADDR_HASH(ip->ip_dst.s_addr), ia_hash) {          for (ia = IN_IFADDR_HASH(ip->ip_dst.s_addr).lh_first;
                ia != NULL;
                ia = ia->ia_hash.le_next) {
                 if (in_hosteq(ia->ia_addr.sin_addr, ip->ip_dst)) {                  if (in_hosteq(ia->ia_addr.sin_addr, ip->ip_dst)) {
                         if ((ia->ia_ifp->if_flags & IFF_UP) != 0)                          if ((ia->ia_ifp->if_flags & IFF_UP) != 0)
                                 break;                                  break;
Line 598  ip_input(struct mbuf *m)
Line 546  ip_input(struct mbuf *m)
         if (ia != NULL)          if (ia != NULL)
                 goto ours;                  goto ours;
         if (m->m_pkthdr.rcvif->if_flags & IFF_BROADCAST) {          if (m->m_pkthdr.rcvif->if_flags & IFF_BROADCAST) {
                 TAILQ_FOREACH(ifa, &m->m_pkthdr.rcvif->if_addrlist, ifa_list) {                  for (ifa = m->m_pkthdr.rcvif->if_addrlist.tqh_first;
                         if (ifa->ifa_addr->sa_family != AF_INET)                      ifa != NULL; ifa = ifa->ifa_list.tqe_next) {
                                 continue;                          if (ifa->ifa_addr->sa_family != AF_INET) continue;
                         ia = ifatoia(ifa);                          ia = ifatoia(ifa);
                         if (in_hosteq(ip->ip_dst, ia->ia_broadaddr.sin_addr) ||                          if (in_hosteq(ip->ip_dst, ia->ia_broadaddr.sin_addr) ||
                             in_hosteq(ip->ip_dst, ia->ia_netbroadcast) ||                              in_hosteq(ip->ip_dst, ia->ia_netbroadcast) ||
Line 624  ip_input(struct mbuf *m)
Line 572  ip_input(struct mbuf *m)
 #ifdef MROUTING  #ifdef MROUTING
                 extern struct socket *ip_mrouter;                  extern struct socket *ip_mrouter;
   
                 if (M_READONLY(m)) {                  if (m->m_flags & M_EXT) {
                         if ((m = m_pullup(m, hlen)) == 0) {                          if ((m = m_pullup(m, hlen)) == 0) {
                                 ipstat.ips_toosmall++;                                  ipstat.ips_toosmall++;
                                 return;                                  return;
Line 695  ip_input(struct mbuf *m)
Line 643  ip_input(struct mbuf *m)
                         ipstat.ips_cantforward++;                          ipstat.ips_cantforward++;
                         return;                          return;
                 }                  }
 #ifdef IPSEC  
                 if (ipsec4_in_reject(m, NULL)) {  
                         ipsecstat.in_polvio++;  
                         goto bad;  
                 }  
 #endif  
   
                 ip_forward(m, 0);                  ip_forward(m, 0);
         }          }
         return;          return;
Line 714  ours:
Line 655  ours:
          * if the packet was previously fragmented,           * if the packet was previously fragmented,
          * but it's not worth the time; just let them time out.)           * but it's not worth the time; just let them time out.)
          */           */
         if (ip->ip_off & ~htons(IP_DF|IP_RF)) {          if (ip->ip_off & ~(IP_DF|IP_RF)) {
                 if (M_READONLY(m)) {  
                         if ((m = m_pullup(m, hlen)) == NULL) {  
                                 ipstat.ips_toosmall++;  
                                 goto bad;  
                         }  
                         ip = mtod(m, struct ip *);  
                 }  
   
                 /*                  /*
                  * Look for queue of fragments                   * Look for queue of fragments
                  * of this datagram.                   * of this datagram.
                  */                   */
                 IPQ_LOCK();                  IPQ_LOCK();
                 LIST_FOREACH(fp, &ipq, ipq_q)                  for (fp = ipq.lh_first; fp != NULL; fp = fp->ipq_q.le_next)
                         if (ip->ip_id == fp->ipq_id &&                          if (ip->ip_id == fp->ipq_id &&
                             in_hosteq(ip->ip_src, fp->ipq_src) &&                              in_hosteq(ip->ip_src, fp->ipq_src) &&
                             in_hosteq(ip->ip_dst, fp->ipq_dst) &&                              in_hosteq(ip->ip_dst, fp->ipq_dst) &&
Line 742  found:
Line 675  found:
                  * set ipqe_mff if more fragments are expected,                   * set ipqe_mff if more fragments are expected,
                  * convert offset of this to bytes.                   * convert offset of this to bytes.
                  */                   */
                 ip->ip_len = htons(ntohs(ip->ip_len) - hlen);                  ip->ip_len -= hlen;
                 mff = (ip->ip_off & htons(IP_MF)) != 0;                  mff = (ip->ip_off & IP_MF) != 0;
                 if (mff) {                  if (mff) {
                         /*                          /*
                          * Make sure that fragments have a data length                           * Make sure that fragments have a data length
                          * that's a non-zero multiple of 8 bytes.                           * that's a non-zero multiple of 8 bytes.
                          */                           */
                         if (ntohs(ip->ip_len) == 0 ||                          if (ip->ip_len == 0 || (ip->ip_len & 0x7) != 0) {
                             (ntohs(ip->ip_len) & 0x7) != 0) {  
                                 ipstat.ips_badfrags++;                                  ipstat.ips_badfrags++;
                                 IPQ_UNLOCK();                                  IPQ_UNLOCK();
                                 goto bad;                                  goto bad;
                         }                          }
                 }                  }
                 ip->ip_off = htons((ntohs(ip->ip_off) & IP_OFFMASK) << 3);                  ip->ip_off <<= 3;
   
                 /*                  /*
                  * If datagram marked as having more fragments                   * If datagram marked as having more fragments
                  * or if this is not the first fragment,                   * or if this is not the first fragment,
                  * attempt reassembly; if it succeeds, proceed.                   * attempt reassembly; if it succeeds, proceed.
                  */                   */
                 if (mff || ip->ip_off != htons(0)) {                  if (mff || ip->ip_off) {
                         ipstat.ips_fragments++;                          ipstat.ips_fragments++;
                         ipqe = pool_get(&ipqent_pool, PR_NOWAIT);                          ipqe = pool_get(&ipqent_pool, PR_NOWAIT);
                         if (ipqe == NULL) {                          if (ipqe == NULL) {
Line 782  found:
Line 714  found:
                         ipstat.ips_reassembled++;                          ipstat.ips_reassembled++;
                         ip = mtod(m, struct ip *);                          ip = mtod(m, struct ip *);
                         hlen = ip->ip_hl << 2;                          hlen = ip->ip_hl << 2;
                         ip->ip_len = htons(ntohs(ip->ip_len) + hlen);                          ip->ip_len += hlen;
                 } else                  } else
                         if (fp)                          if (fp)
                                 ip_freef(fp);                                  ip_freef(fp);
Line 807  found:
Line 739  found:
          */           */
 #if IFA_STATS  #if IFA_STATS
         if (ia && ip)          if (ia && ip)
                 ia->ia_ifa.ifa_data.ifad_inbytes += ntohs(ip->ip_len);                  ia->ia_ifa.ifa_data.ifad_inbytes += ip->ip_len;
 #endif  #endif
         ipstat.ips_delivered++;          ipstat.ips_delivered++;
     {      {
Line 818  found:
Line 750  found:
     }      }
 bad:  bad:
         m_freem(m);          m_freem(m);
         return;  
   
 badcsum:  
         ipstat.ips_badsum++;  
         m_freem(m);  
 }  }
   
 /*  /*
Line 875  ip_reass(ipqe, fp)
Line 802  ip_reass(ipqe, fp)
                 fp->ipq_ttl = IPFRAGTTL;                  fp->ipq_ttl = IPFRAGTTL;
                 fp->ipq_p = ipqe->ipqe_ip->ip_p;                  fp->ipq_p = ipqe->ipqe_ip->ip_p;
                 fp->ipq_id = ipqe->ipqe_ip->ip_id;                  fp->ipq_id = ipqe->ipqe_ip->ip_id;
                 TAILQ_INIT(&fp->ipq_fragq);                  LIST_INIT(&fp->ipq_fragq);
                 fp->ipq_src = ipqe->ipqe_ip->ip_src;                  fp->ipq_src = ipqe->ipqe_ip->ip_src;
                 fp->ipq_dst = ipqe->ipqe_ip->ip_dst;                  fp->ipq_dst = ipqe->ipqe_ip->ip_dst;
                 p = NULL;                  p = NULL;
Line 885  ip_reass(ipqe, fp)
Line 812  ip_reass(ipqe, fp)
         /*          /*
          * Find a segment which begins after this one does.           * Find a segment which begins after this one does.
          */           */
         for (p = NULL, q = TAILQ_FIRST(&fp->ipq_fragq); q != NULL;          for (p = NULL, q = fp->ipq_fragq.lh_first; q != NULL;
             p = q, q = TAILQ_NEXT(q, ipqe_q))              p = q, q = q->ipqe_q.le_next)
                 if (ntohs(q->ipqe_ip->ip_off) > ntohs(ipqe->ipqe_ip->ip_off))                  if (q->ipqe_ip->ip_off > ipqe->ipqe_ip->ip_off)
                         break;                          break;
   
         /*          /*
Line 896  ip_reass(ipqe, fp)
Line 823  ip_reass(ipqe, fp)
          * segment.  If it provides all of our data, drop us.           * segment.  If it provides all of our data, drop us.
          */           */
         if (p != NULL) {          if (p != NULL) {
                 i = ntohs(p->ipqe_ip->ip_off) + ntohs(p->ipqe_ip->ip_len) -                  i = p->ipqe_ip->ip_off + p->ipqe_ip->ip_len -
                     ntohs(ipqe->ipqe_ip->ip_off);                      ipqe->ipqe_ip->ip_off;
                 if (i > 0) {                  if (i > 0) {
                         if (i >= ntohs(ipqe->ipqe_ip->ip_len))                          if (i >= ipqe->ipqe_ip->ip_len)
                                 goto dropfrag;                                  goto dropfrag;
                         m_adj(ipqe->ipqe_m, i);                          m_adj(ipqe->ipqe_m, i);
                         ipqe->ipqe_ip->ip_off =                          ipqe->ipqe_ip->ip_off += i;
                             htons(ntohs(ipqe->ipqe_ip->ip_off) + i);                          ipqe->ipqe_ip->ip_len -= i;
                         ipqe->ipqe_ip->ip_len =  
                             htons(ntohs(ipqe->ipqe_ip->ip_len) - i);  
                 }                  }
         }          }
   
Line 913  ip_reass(ipqe, fp)
Line 838  ip_reass(ipqe, fp)
          * While we overlap succeeding segments trim them or,           * While we overlap succeeding segments trim them or,
          * if they are completely covered, dequeue them.           * if they are completely covered, dequeue them.
          */           */
         for (; q != NULL &&          for (; q != NULL && ipqe->ipqe_ip->ip_off + ipqe->ipqe_ip->ip_len >
             ntohs(ipqe->ipqe_ip->ip_off) + ntohs(ipqe->ipqe_ip->ip_len) >              q->ipqe_ip->ip_off; q = nq) {
             ntohs(q->ipqe_ip->ip_off); q = nq) {                  i = (ipqe->ipqe_ip->ip_off + ipqe->ipqe_ip->ip_len) -
                 i = (ntohs(ipqe->ipqe_ip->ip_off) +                      q->ipqe_ip->ip_off;
                     ntohs(ipqe->ipqe_ip->ip_len)) - ntohs(q->ipqe_ip->ip_off);                  if (i < q->ipqe_ip->ip_len) {
                 if (i < ntohs(q->ipqe_ip->ip_len)) {                          q->ipqe_ip->ip_len -= i;
                         q->ipqe_ip->ip_len =                          q->ipqe_ip->ip_off += i;
                             htons(ntohs(q->ipqe_ip->ip_len) - i);  
                         q->ipqe_ip->ip_off =  
                             htons(ntohs(q->ipqe_ip->ip_off) + i);  
                         m_adj(q->ipqe_m, i);                          m_adj(q->ipqe_m, i);
                         break;                          break;
                 }                  }
                 nq = TAILQ_NEXT(q, ipqe_q);                  nq = q->ipqe_q.le_next;
                 m_freem(q->ipqe_m);                  m_freem(q->ipqe_m);
                 TAILQ_REMOVE(&fp->ipq_fragq, q, ipqe_q);                  LIST_REMOVE(q, ipqe_q);
                 pool_put(&ipqent_pool, q);                  pool_put(&ipqent_pool, q);
         }          }
   
Line 938  insert:
Line 860  insert:
          * check for complete reassembly.           * check for complete reassembly.
          */           */
         if (p == NULL) {          if (p == NULL) {
                 TAILQ_INSERT_HEAD(&fp->ipq_fragq, ipqe, ipqe_q);                  LIST_INSERT_HEAD(&fp->ipq_fragq, ipqe, ipqe_q);
         } else {          } else {
                 TAILQ_INSERT_AFTER(&fp->ipq_fragq, p, ipqe, ipqe_q);                  LIST_INSERT_AFTER(p, ipqe, ipqe_q);
         }          }
         next = 0;          next = 0;
         for (p = NULL, q = TAILQ_FIRST(&fp->ipq_fragq); q != NULL;          for (p = NULL, q = fp->ipq_fragq.lh_first; q != NULL;
             p = q, q = TAILQ_NEXT(q, ipqe_q)) {              p = q, q = q->ipqe_q.le_next) {
                 if (ntohs(q->ipqe_ip->ip_off) != next)                  if (q->ipqe_ip->ip_off != next)
                         return (0);                          return (0);
                 next += ntohs(q->ipqe_ip->ip_len);                  next += q->ipqe_ip->ip_len;
         }          }
         if (p->ipqe_mff)          if (p->ipqe_mff)
                 return (0);                  return (0);
Line 956  insert:
Line 878  insert:
          * Reassembly is complete.  Check for a bogus message size and           * Reassembly is complete.  Check for a bogus message size and
          * concatenate fragments.           * concatenate fragments.
          */           */
         q = TAILQ_FIRST(&fp->ipq_fragq);          q = fp->ipq_fragq.lh_first;
         ip = q->ipqe_ip;          ip = q->ipqe_ip;
         if ((next + (ip->ip_hl << 2)) > IP_MAXPACKET) {          if ((next + (ip->ip_hl << 2)) > IP_MAXPACKET) {
                 ipstat.ips_toolong++;                  ipstat.ips_toolong++;
Line 967  insert:
Line 889  insert:
         t = m->m_next;          t = m->m_next;
         m->m_next = 0;          m->m_next = 0;
         m_cat(m, t);          m_cat(m, t);
         nq = TAILQ_NEXT(q, ipqe_q);          nq = q->ipqe_q.le_next;
         pool_put(&ipqent_pool, q);          pool_put(&ipqent_pool, q);
         for (q = nq; q != NULL; q = nq) {          for (q = nq; q != NULL; q = nq) {
                 t = q->ipqe_m;                  t = q->ipqe_m;
                 nq = TAILQ_NEXT(q, ipqe_q);                  nq = q->ipqe_q.le_next;
                 pool_put(&ipqent_pool, q);                  pool_put(&ipqent_pool, q);
                 m_cat(m, t);                  m_cat(m, t);
         }          }
Line 982  insert:
Line 904  insert:
          * dequeue and discard fragment reassembly header.           * dequeue and discard fragment reassembly header.
          * Make header visible.           * Make header visible.
          */           */
         ip->ip_len = htons(next);          ip->ip_len = next;
         ip->ip_src = fp->ipq_src;          ip->ip_src = fp->ipq_src;
         ip->ip_dst = fp->ipq_dst;          ip->ip_dst = fp->ipq_dst;
         LIST_REMOVE(fp, ipq_q);          LIST_REMOVE(fp, ipq_q);
Line 1018  ip_freef(fp)
Line 940  ip_freef(fp)
   
         IPQ_LOCK_CHECK();          IPQ_LOCK_CHECK();
   
         for (q = TAILQ_FIRST(&fp->ipq_fragq); q != NULL; q = p) {          for (q = fp->ipq_fragq.lh_first; q != NULL; q = p) {
                 p = TAILQ_NEXT(q, ipqe_q);                  p = q->ipqe_q.le_next;
                 m_freem(q->ipqe_m);                  m_freem(q->ipqe_m);
                 TAILQ_REMOVE(&fp->ipq_fragq, q, ipqe_q);                  LIST_REMOVE(q, ipqe_q);
                 pool_put(&ipqent_pool, q);                  pool_put(&ipqent_pool, q);
         }          }
         LIST_REMOVE(fp, ipq_q);          LIST_REMOVE(fp, ipq_q);
Line 1041  ip_slowtimo()
Line 963  ip_slowtimo()
         int s = splsoftnet();          int s = splsoftnet();
   
         IPQ_LOCK();          IPQ_LOCK();
         for (fp = LIST_FIRST(&ipq); fp != NULL; fp = nfp) {          for (fp = ipq.lh_first; fp != NULL; fp = nfp) {
                 nfp = LIST_NEXT(fp, ipq_q);                  nfp = fp->ipq_q.le_next;
                 if (--fp->ipq_ttl == 0) {                  if (--fp->ipq_ttl == 0) {
                         ipstat.ips_fragtimeout++;                          ipstat.ips_fragtimeout++;
                         ip_freef(fp);                          ip_freef(fp);
Line 1056  ip_slowtimo()
Line 978  ip_slowtimo()
         if (ip_maxfragpackets < 0)          if (ip_maxfragpackets < 0)
                 ;                  ;
         else {          else {
                 while (ip_nfragpackets > ip_maxfragpackets && LIST_FIRST(&ipq))                  while (ip_nfragpackets > ip_maxfragpackets && ipq.lh_first)
                         ip_freef(LIST_FIRST(&ipq));                          ip_freef(ipq.lh_first);
         }          }
         IPQ_UNLOCK();          IPQ_UNLOCK();
 #ifdef GATEWAY  #ifdef GATEWAY
Line 1080  ip_drain()
Line 1002  ip_drain()
         if (ipq_lock_try() == 0)          if (ipq_lock_try() == 0)
                 return;                  return;
   
         while (LIST_FIRST(&ipq) != NULL) {          while (ipq.lh_first != NULL) {
                 ipstat.ips_fragdropped++;                  ipstat.ips_fragdropped++;
                 ip_freef(LIST_FIRST(&ipq));                  ip_freef(ipq.lh_first);
         }          }
   
         IPQ_UNLOCK();          IPQ_UNLOCK();
Line 1465  ip_stripoptions(m, mopt)
Line 1387  ip_stripoptions(m, mopt)
         m->m_len -= olen;          m->m_len -= olen;
         if (m->m_flags & M_PKTHDR)          if (m->m_flags & M_PKTHDR)
                 m->m_pkthdr.len -= olen;                  m->m_pkthdr.len -= olen;
         ip->ip_len = htons(ntohs(ip->ip_len) - olen);          ip->ip_len -= olen;
         ip->ip_hl = sizeof (struct ip) >> 2;          ip->ip_hl = sizeof (struct ip) >> 2;
 }  }
   
 const int inetctlerrmap[PRC_NCMDS] = {  int inetctlerrmap[PRC_NCMDS] = {
         0,              0,              0,              0,          0,              0,              0,              0,
         0,              EMSGSIZE,       EHOSTDOWN,      EHOSTUNREACH,          0,              EMSGSIZE,       EHOSTDOWN,      EHOSTUNREACH,
         EHOSTUNREACH,   EHOSTUNREACH,   ECONNREFUSED,   ECONNREFUSED,          EHOSTUNREACH,   EHOSTUNREACH,   ECONNREFUSED,   ECONNREFUSED,
Line 1508  ip_forward(m, srcrt)
Line 1430  ip_forward(m, srcrt)
         struct ifnet dummyifp;          struct ifnet dummyifp;
 #endif  #endif
   
         /*  
          * Clear any in-bound checksum flags for this packet.  
          */  
         m->m_pkthdr.csum_flags = 0;  
   
         dest = 0;          dest = 0;
 #ifdef DIAGNOSTIC  #ifdef DIAGNOSTIC
         if (ipprintfs)          if (ipprintfs)
Line 1555  ip_forward(m, srcrt)
Line 1472  ip_forward(m, srcrt)
          * we need to generate an ICMP message to the src.           * we need to generate an ICMP message to the src.
          * Pullup to avoid sharing mbuf cluster between m and mcopy.           * Pullup to avoid sharing mbuf cluster between m and mcopy.
          */           */
         mcopy = m_copym(m, 0, imin(ntohs(ip->ip_len), 68), M_DONTWAIT);          mcopy = m_copym(m, 0, imin((int)ip->ip_len, 68), M_DONTWAIT);
         if (mcopy)          if (mcopy)
                 mcopy = m_pullup(mcopy, ip->ip_hl << 2);                  mcopy = m_pullup(mcopy, ip->ip_hl << 2);
   
Line 1593  ip_forward(m, srcrt)
Line 1510  ip_forward(m, srcrt)
         }          }
   
 #ifdef IPSEC  #ifdef IPSEC
         /* Don't lookup socket in forwarding case */          /* Don't lookup socket in forwading case */
         (void)ipsec_setsocket(m, NULL);          (void)ipsec_setsocket(m, NULL);
 #endif  #endif
         error = ip_output(m, (struct mbuf *)0, &ipforward_rt,          error = ip_output(m, (struct mbuf *)0, &ipforward_rt,
Line 1682  ip_forward(m, srcrt)
Line 1599  ip_forward(m, srcrt)
                                         ro = &sp->req->sav->sah->sa_route;                                          ro = &sp->req->sav->sah->sa_route;
                                         if (ro->ro_rt && ro->ro_rt->rt_ifp) {                                          if (ro->ro_rt && ro->ro_rt->rt_ifp) {
                                                 dummyifp.if_mtu =                                                  dummyifp.if_mtu =
                                                     ro->ro_rt->rt_rmx.rmx_mtu ?  
                                                     ro->ro_rt->rt_rmx.rmx_mtu :  
                                                     ro->ro_rt->rt_ifp->if_mtu;                                                      ro->ro_rt->rt_ifp->if_mtu;
                                                 dummyifp.if_mtu -= ipsechdr;                                                  dummyifp.if_mtu -= ipsechdr;
                                                 destifp = &dummyifp;                                                  destifp = &dummyifp;
Line 1698  ip_forward(m, srcrt)
Line 1613  ip_forward(m, srcrt)
                 break;                  break;
   
         case ENOBUFS:          case ENOBUFS:
 #if 1  
                 /*  
                  * a router should not generate ICMP_SOURCEQUENCH as  
                  * required in RFC1812 Requirements for IP Version 4 Routers.  
                  * source quench could be a big problem under DoS attacks,  
                  * or if the underlying interface is rate-limited.  
                  */  
                 if (mcopy)  
                         m_freem(mcopy);  
                 return;  
 #else  
                 type = ICMP_SOURCEQUENCH;                  type = ICMP_SOURCEQUENCH;
                 code = 0;                  code = 0;
                 break;                  break;
 #endif  
         }          }
         icmp_error(mcopy, type, code, dest, destifp);          icmp_error(mcopy, type, code, dest, destifp);
 }  }
Line 1826  ip_sysctl(name, namelen, oldp, oldlenp, 
Line 1729  ip_sysctl(name, namelen, oldp, oldlenp, 
         case IPCTL_MTUDISC:          case IPCTL_MTUDISC:
                 error = sysctl_int(oldp, oldlenp, newp, newlen,                  error = sysctl_int(oldp, oldlenp, newp, newlen,
                     &ip_mtudisc);                      &ip_mtudisc);
                 if (error == 0 && ip_mtudisc == 0)                  if (ip_mtudisc != 0 && ip_mtudisc_timeout_q == NULL) {
                         rt_timer_queue_remove_all(ip_mtudisc_timeout_q, TRUE);                          ip_mtudisc_timeout_q =
                               rt_timer_queue_create(ip_mtudisc_timeout);
                   } else if (ip_mtudisc == 0 && ip_mtudisc_timeout_q != NULL) {
                           rt_timer_queue_destroy(ip_mtudisc_timeout_q, TRUE);
                           ip_mtudisc_timeout_q = NULL;
                   }
                 return error;                  return error;
         case IPCTL_ANONPORTMIN:          case IPCTL_ANONPORTMIN:
                 old = anonportmin;                  old = anonportmin;
Line 1856  ip_sysctl(name, namelen, oldp, oldlenp, 
Line 1764  ip_sysctl(name, namelen, oldp, oldlenp, 
                 }                  }
                 return (error);                  return (error);
         case IPCTL_MTUDISCTIMEOUT:          case IPCTL_MTUDISCTIMEOUT:
                 old = ip_mtudisc_timeout;  
                 error = sysctl_int(oldp, oldlenp, newp, newlen,                  error = sysctl_int(oldp, oldlenp, newp, newlen,
                    &ip_mtudisc_timeout);                     &ip_mtudisc_timeout);
                 if (ip_mtudisc_timeout < 0) {                  if (ip_mtudisc_timeout_q != NULL)
                         ip_mtudisc_timeout = old;                          rt_timer_queue_change(ip_mtudisc_timeout_q,
                         return (EINVAL);  
                 }  
                 if (error == 0)  
                         rt_timer_queue_change(ip_mtudisc_timeout_q,  
                                               ip_mtudisc_timeout);                                                ip_mtudisc_timeout);
                 return (error);                  return (error);
 #ifdef GATEWAY  #ifdef GATEWAY
Line 1885  ip_sysctl(name, namelen, oldp, oldlenp, 
Line 1788  ip_sysctl(name, namelen, oldp, oldlenp, 
                     &hostzeroisbroadcast));                      &hostzeroisbroadcast));
 #if NGIF > 0  #if NGIF > 0
         case IPCTL_GIF_TTL:          case IPCTL_GIF_TTL:
                 return (sysctl_int(oldp, oldlenp, newp, newlen,                  return(sysctl_int(oldp, oldlenp, newp, newlen,
                                   &ip_gif_ttl));                                    &ip_gif_ttl));
 #endif  #endif
   
 #if NGRE > 0  
         case IPCTL_GRE_TTL:  
                 return (sysctl_int(oldp, oldlenp, newp, newlen,  
                                   &ip_gre_ttl));  
 #endif  
   
 #ifndef IPNOPRIVPORTS  #ifndef IPNOPRIVPORTS
         case IPCTL_LOWPORTMIN:          case IPCTL_LOWPORTMIN:
                 old = lowportmin;                  old = lowportmin;

Legend:
Removed from v.1.130.2.16  
changed lines
  Added in v.1.131

CVSweb <webmaster@jp.NetBSD.org>