[BACK]Return to ip_input.c CVS log [TXT][DIR] Up to [cvs.NetBSD.org] / src / sys / netinet

Please note that diffs are not public domain; they are subject to the copyright notices on the relevant files.

Diff for /src/sys/netinet/ip_input.c between version 1.314 and 1.355.2.3

version 1.314, 2014/05/23 23:38:48 version 1.355.2.3, 2018/01/02 10:20:34
Line 93 
Line 93 
 #include <sys/cdefs.h>  #include <sys/cdefs.h>
 __KERNEL_RCSID(0, "$NetBSD$");  __KERNEL_RCSID(0, "$NetBSD$");
   
   #ifdef _KERNEL_OPT
 #include "opt_inet.h"  #include "opt_inet.h"
 #include "opt_compat_netbsd.h"  #include "opt_compat_netbsd.h"
 #include "opt_gateway.h"  #include "opt_gateway.h"
Line 100  __KERNEL_RCSID(0, "$NetBSD$");
Line 101  __KERNEL_RCSID(0, "$NetBSD$");
 #include "opt_mrouting.h"  #include "opt_mrouting.h"
 #include "opt_mbuftrace.h"  #include "opt_mbuftrace.h"
 #include "opt_inet_csum.h"  #include "opt_inet_csum.h"
   #include "opt_net_mpsafe.h"
   #endif
   
   #include "arp.h"
   
 #include <sys/param.h>  #include <sys/param.h>
 #include <sys/systm.h>  #include <sys/systm.h>
   #include <sys/cpu.h>
 #include <sys/mbuf.h>  #include <sys/mbuf.h>
 #include <sys/domain.h>  #include <sys/domain.h>
 #include <sys/protosw.h>  #include <sys/protosw.h>
Line 118  __KERNEL_RCSID(0, "$NetBSD$");
Line 124  __KERNEL_RCSID(0, "$NetBSD$");
 #include <net/if.h>  #include <net/if.h>
 #include <net/if_dl.h>  #include <net/if_dl.h>
 #include <net/route.h>  #include <net/route.h>
   #include <net/pktqueue.h>
 #include <net/pfil.h>  #include <net/pfil.h>
   
 #include <netinet/in.h>  #include <netinet/in.h>
Line 210  int ip_do_randomid = 0;
Line 217  int ip_do_randomid = 0;
  * to the loopback interface instead of the interface where the   * to the loopback interface instead of the interface where the
  * packets for those addresses are received.   * packets for those addresses are received.
  */   */
 int     ip_checkinterface = 0;  static int              ip_checkinterface       __read_mostly = 0;
   
 struct rttimer_queue *ip_mtudisc_timeout_q = NULL;  struct rttimer_queue *ip_mtudisc_timeout_q = NULL;
   
 struct  ifqueue ipintrq;  pktqueue_t *            ip_pktq                 __read_mostly;
   pfil_head_t *           inet_pfil_hook          __read_mostly;
 ipid_state_t *          ip_ids;  ipid_state_t *          ip_ids                  __read_mostly;
 uint16_t ip_id;  percpu_t *              ipstat_percpu           __read_mostly;
   
 percpu_t *ipstat_percpu;  static percpu_t         *ipforward_rt_percpu    __cacheline_aligned;
   
 pfil_head_t *inet_pfil_hook;  uint16_t ip_id;
   
 #ifdef INET_CSUM_COUNTERS  #ifdef INET_CSUM_COUNTERS
 #include <sys/device.h>  #include <sys/device.h>
Line 246  EVCNT_ATTACH_STATIC(ip_swcsum);
Line 253  EVCNT_ATTACH_STATIC(ip_swcsum);
 #endif /* INET_CSUM_COUNTERS */  #endif /* INET_CSUM_COUNTERS */
   
 /*  /*
  * We need to save the IP options in case a protocol wants to respond   * Used to save the IP options in case a protocol wants to respond
  * to an incoming packet over the same route if the packet got here   * to an incoming packet over the same route if the packet got here
  * using IP source routing.  This allows connection establishment and   * using IP source routing.  This allows connection establishment and
  * maintenance when the remote end is on a network that is not known   * maintenance when the remote end is on a network that is not known
  * to us.   * to us.
  */   */
   struct ip_srcrt {
 static int      ip_nhops = 0;          int             isr_nhops;                 /* number of hops */
           struct in_addr  isr_dst;                   /* final destination */
 static  struct ip_srcrt {          char            isr_nop;                   /* one NOP to align */
         struct  in_addr dst;                    /* final destination */          char            isr_hdr[IPOPT_OFFSET + 1]; /* OPTVAL, OLEN & OFFSET */
         char    nop;                            /* one NOP to align */          struct in_addr  isr_routes[MAX_IPOPTLEN/sizeof(struct in_addr)];
         char    srcopt[IPOPT_OFFSET + 1];       /* OPTVAL, OLEN and OFFSET */  };
         struct  in_addr route[MAX_IPOPTLEN/sizeof(struct in_addr)];  
 } ip_srcrt;  
   
 static int ip_drainwanted;  static int ip_drainwanted;
   
 static void save_rte(u_char *, struct in_addr);  static void save_rte(struct mbuf *, u_char *, struct in_addr);
   
 #ifdef MBUFTRACE  #ifdef MBUFTRACE
 struct mowner ip_rx_mowner = MOWNER_INIT("internet", "rx");  struct mowner ip_rx_mowner = MOWNER_INIT("internet", "rx");
 struct mowner ip_tx_mowner = MOWNER_INIT("internet", "tx");  struct mowner ip_tx_mowner = MOWNER_INIT("internet", "tx");
 #endif  #endif
   
   static void             ipintr(void *);
 static void             ip_input(struct mbuf *);  static void             ip_input(struct mbuf *);
 static void             ip_forward(struct mbuf *, int);  static void             ip_forward(struct mbuf *, int, struct ifnet *);
 static bool             ip_dooptions(struct mbuf *);  static bool             ip_dooptions(struct mbuf *);
 static struct in_ifaddr *ip_rtaddr(struct in_addr);  static struct in_ifaddr *ip_rtaddr(struct in_addr, struct psref *);
 static void             sysctl_net_inet_ip_setup(struct sysctllog **);  static void             sysctl_net_inet_ip_setup(struct sysctllog **);
   
   static struct in_ifaddr *ip_match_our_address(struct ifnet *, struct ip *,
                               int *);
   static struct in_ifaddr *ip_match_our_address_broadcast(struct ifnet *,
                               struct ip *);
   
   #ifdef NET_MPSAFE
   #define SOFTNET_LOCK()          mutex_enter(softnet_lock)
   #define SOFTNET_UNLOCK()        mutex_exit(softnet_lock)
   #else
   #define SOFTNET_LOCK()          KASSERT(mutex_owned(softnet_lock))
   #define SOFTNET_UNLOCK()        KASSERT(mutex_owned(softnet_lock))
   #endif
   
 /*  /*
  * IP initialization: fill in IP protocol switch table.   * IP initialization: fill in IP protocol switch table.
  * All protocols not implemented in kernel go to raw IP protocol handler.   * All protocols not implemented in kernel go to raw IP protocol handler.
Line 292  ip_init(void)
Line 311  ip_init(void)
         pr = pffindproto(PF_INET, IPPROTO_RAW, SOCK_RAW);          pr = pffindproto(PF_INET, IPPROTO_RAW, SOCK_RAW);
         KASSERT(pr != NULL);          KASSERT(pr != NULL);
   
           ip_pktq = pktq_create(IFQ_MAXLEN, ipintr, NULL);
           KASSERT(ip_pktq != NULL);
   
         for (u_int i = 0; i < IPPROTO_MAX; i++) {          for (u_int i = 0; i < IPPROTO_MAX; i++) {
                 ip_protox[i] = pr - inetsw;                  ip_protox[i] = pr - inetsw;
         }          }
Line 304  ip_init(void)
Line 326  ip_init(void)
         ip_reass_init();          ip_reass_init();
   
         ip_ids = ip_id_init();          ip_ids = ip_id_init();
         ip_id = time_second & 0xfffff;          ip_id = time_uptime & 0xfffff;
   
         ipintrq.ifq_maxlen = IFQ_MAXLEN;  
   
         ip_mtudisc_timeout_q = rt_timer_queue_create(ip_mtudisc_timeout);  
 #ifdef GATEWAY  #ifdef GATEWAY
         ipflow_init();          ipflow_init();
 #endif  #endif
Line 323  ip_init(void)
Line 342  ip_init(void)
 #endif /* MBUFTRACE */  #endif /* MBUFTRACE */
   
         ipstat_percpu = percpu_alloc(sizeof(uint64_t) * IP_NSTATS);          ipstat_percpu = percpu_alloc(sizeof(uint64_t) * IP_NSTATS);
           ipforward_rt_percpu = percpu_alloc(sizeof(struct route));
           ip_mtudisc_timeout_q = rt_timer_queue_create(ip_mtudisc_timeout);
 }  }
   
 struct  sockaddr_in ipaddr = {  static struct in_ifaddr *
         .sin_len = sizeof(ipaddr),  ip_match_our_address(struct ifnet *ifp, struct ip *ip, int *downmatch)
         .sin_family = AF_INET,  {
 };          struct in_ifaddr *ia = NULL;
           int checkif;
   
 static struct route     ipforward_rt;          /*
            * Enable a consistency check between the destination address
            * and the arrival interface for a unicast packet (the RFC 1122
            * strong ES model) if IP forwarding is disabled and the packet
            * is not locally generated.
            *
            * XXX - Checking also should be disabled if the destination
            * address is ipnat'ed to a different interface.
            *
            * XXX - Checking is incompatible with IP aliases added
            * to the loopback interface instead of the interface where
            * the packets are received.
            *
            * XXX - We need to add a per ifaddr flag for this so that
            * we get finer grain control.
            */
           checkif = ip_checkinterface && (ipforwarding == 0) &&
               (ifp->if_flags & IFF_LOOPBACK) == 0;
   
 /*          IN_ADDRHASH_READER_FOREACH(ia, ip->ip_dst.s_addr) {
  * IP software interrupt routine                  if (in_hosteq(ia->ia_addr.sin_addr, ip->ip_dst)) {
  */                          if (ia->ia4_flags & IN_IFF_NOTREADY)
 void                                  continue;
 ipintr(void)                          if (checkif && ia->ia_ifp != ifp)
                                   continue;
                           if ((ia->ia_ifp->if_flags & IFF_UP) == 0) {
                                   (*downmatch)++;
                                   continue;
                           }
                           if (ia->ia4_flags & IN_IFF_DETACHED &&
                               (ifp->if_flags & IFF_LOOPBACK) == 0)
                                   continue;
                           break;
                   }
           }
   
           return ia;
   }
   
   static struct in_ifaddr *
   ip_match_our_address_broadcast(struct ifnet *ifp, struct ip *ip)
 {  {
         int s;          struct in_ifaddr *ia = NULL;
         struct mbuf *m;          struct ifaddr *ifa;
         struct ifqueue lcl_intrq;  
   
         memset(&lcl_intrq, 0, sizeof(lcl_intrq));          IFADDR_READER_FOREACH(ifa, ifp) {
                   if (ifa->ifa_addr->sa_family != AF_INET)
                           continue;
                   ia = ifatoia(ifa);
                   if (ia->ia4_flags & IN_IFF_NOTREADY)
                           continue;
                   if (ia->ia4_flags & IN_IFF_DETACHED &&
                       (ifp->if_flags & IFF_LOOPBACK) == 0)
                           continue;
                   if (in_hosteq(ip->ip_dst, ia->ia_broadaddr.sin_addr) ||
                       in_hosteq(ip->ip_dst, ia->ia_netbroadcast) ||
                       /*
                        * Look for all-0's host part (old broadcast addr),
                        * either for subnet or net.
                        */
                       ip->ip_dst.s_addr == ia->ia_subnet ||
                       ip->ip_dst.s_addr == ia->ia_net)
                           goto matched;
                   /*
                    * An interface with IP address zero accepts
                    * all packets that arrive on that interface.
                    */
                   if (in_nullhost(ia->ia_addr.sin_addr))
                           goto matched;
           }
           ia = NULL;
   
         mutex_enter(softnet_lock);  matched:
         KERNEL_LOCK(1, NULL);          return ia;
         if (!IF_IS_EMPTY(&ipintrq)) {  }
                 s = splnet();  
   
                 /* Take existing queue onto stack */  /*
                 lcl_intrq = ipintrq;   * IP software interrupt routine.
    */
   static void
   ipintr(void *arg __unused)
   {
           struct mbuf *m;
   
                 /* Zero out global queue, preserving maxlen and drops */          KASSERT(cpu_softintr_p());
                 ipintrq.ifq_head = NULL;  
                 ipintrq.ifq_tail = NULL;  
                 ipintrq.ifq_len = 0;  
                 ipintrq.ifq_maxlen = lcl_intrq.ifq_maxlen;  
                 ipintrq.ifq_drops = lcl_intrq.ifq_drops;  
   
                 splx(s);          SOFTNET_LOCK_UNLESS_NET_MPSAFE();
         }          while ((m = pktq_dequeue(ip_pktq)) != NULL) {
         KERNEL_UNLOCK_ONE(NULL);  
         while (!IF_IS_EMPTY(&lcl_intrq)) {  
                 IF_DEQUEUE(&lcl_intrq, m);  
                 if (m == NULL)  
                         break;  
                 ip_input(m);                  ip_input(m);
         }          }
         mutex_exit(softnet_lock);          SOFTNET_UNLOCK_UNLESS_NET_MPSAFE();
 }  }
   
 /*  /*
  * Ip input routine.  Checksum and byte swap header.  If fragmented   * IP input routine.  Checksum and byte swap header.  If fragmented
  * try to reassemble.  Process options.  Pass to next level.   * try to reassemble.  Process options.  Pass to next level.
  */   */
 static void  static void
 ip_input(struct mbuf *m)  ip_input(struct mbuf *m)
 {  {
         struct ip *ip = NULL;          struct ip *ip = NULL;
         struct in_ifaddr *ia;          struct in_ifaddr *ia = NULL;
         struct ifaddr *ifa;  
         int hlen = 0, len;          int hlen = 0, len;
         int downmatch;          int downmatch;
         int checkif;  
         int srcrt = 0;          int srcrt = 0;
         ifnet_t *ifp;          ifnet_t *ifp;
           struct psref psref;
           int s;
   
           KASSERTMSG(cpu_softintr_p(), "ip_input: not in the software "
               "interrupt handler; synchronization assumptions violated");
   
         MCLAIM(m, &ip_rx_mowner);          MCLAIM(m, &ip_rx_mowner);
         KASSERT((m->m_flags & M_PKTHDR) != 0);          KASSERT((m->m_flags & M_PKTHDR) != 0);
         ifp = m->m_pkthdr.rcvif;  
           ifp = m_get_rcvif_psref(m, &psref);
           if (__predict_false(ifp == NULL))
                   goto out;
   
         /*          /*
          * If no IP addresses have been set yet but the interfaces           * If no IP addresses have been set yet but the interfaces
          * are receiving, can't do anything with incoming packets yet.           * are receiving, can't do anything with incoming packets yet.
            * Note: we pre-check without locks held.
          */           */
         if (TAILQ_FIRST(&in_ifaddrhead) == 0)          if (IN_ADDRLIST_READER_EMPTY())
                 goto bad;                  goto out;
         IP_STATINC(IP_STAT_TOTAL);          IP_STATINC(IP_STAT_TOTAL);
   
         /*          /*
          * If the IP header is not aligned, slurp it up into a new           * If the IP header is not aligned, slurp it up into a new
          * mbuf with space for link headers, in the event we forward           * mbuf with space for link headers, in the event we forward
Line 409  ip_input(struct mbuf *m)
Line 491  ip_input(struct mbuf *m)
                                   (max_linkhdr + 3) & ~3)) == NULL) {                                    (max_linkhdr + 3) & ~3)) == NULL) {
                         /* XXXJRT new stat, please */                          /* XXXJRT new stat, please */
                         IP_STATINC(IP_STAT_TOOSMALL);                          IP_STATINC(IP_STAT_TOOSMALL);
                         return;                          goto out;
                 }                  }
         } else if (__predict_false(m->m_len < sizeof (struct ip))) {          } else if (__predict_false(m->m_len < sizeof (struct ip))) {
                 if ((m = m_pullup(m, sizeof (struct ip))) == NULL) {                  if ((m = m_pullup(m, sizeof (struct ip))) == NULL) {
                         IP_STATINC(IP_STAT_TOOSMALL);                          IP_STATINC(IP_STAT_TOOSMALL);
                         return;                          goto out;
                 }                  }
         }          }
         ip = mtod(m, struct ip *);          ip = mtod(m, struct ip *);
         if (ip->ip_v != IPVERSION) {          if (ip->ip_v != IPVERSION) {
                 IP_STATINC(IP_STAT_BADVERS);                  IP_STATINC(IP_STAT_BADVERS);
                 goto bad;                  goto out;
         }          }
         hlen = ip->ip_hl << 2;          hlen = ip->ip_hl << 2;
         if (hlen < sizeof(struct ip)) { /* minimum header length */          if (hlen < sizeof(struct ip)) { /* minimum header length */
                 IP_STATINC(IP_STAT_BADHLEN);                  IP_STATINC(IP_STAT_BADHLEN);
                 goto bad;                  goto out;
         }          }
         if (hlen > m->m_len) {          if (hlen > m->m_len) {
                 if ((m = m_pullup(m, hlen)) == NULL) {                  if ((m = m_pullup(m, hlen)) == NULL) {
                         IP_STATINC(IP_STAT_BADHLEN);                          IP_STATINC(IP_STAT_BADHLEN);
                         return;                          goto out;
                 }                  }
                 ip = mtod(m, struct ip *);                  ip = mtod(m, struct ip *);
         }          }
Line 441  ip_input(struct mbuf *m)
Line 523  ip_input(struct mbuf *m)
          */           */
         if (IN_MULTICAST(ip->ip_src.s_addr)) {          if (IN_MULTICAST(ip->ip_src.s_addr)) {
                 IP_STATINC(IP_STAT_BADADDR);                  IP_STATINC(IP_STAT_BADADDR);
                 goto bad;                  goto out;
         }          }
   
         /* 127/8 must not appear on wire - RFC1122 */          /* 127/8 must not appear on wire - RFC1122 */
Line 449  ip_input(struct mbuf *m)
Line 531  ip_input(struct mbuf *m)
             (ntohl(ip->ip_src.s_addr) >> IN_CLASSA_NSHIFT) == IN_LOOPBACKNET) {              (ntohl(ip->ip_src.s_addr) >> IN_CLASSA_NSHIFT) == IN_LOOPBACKNET) {
                 if ((ifp->if_flags & IFF_LOOPBACK) == 0) {                  if ((ifp->if_flags & IFF_LOOPBACK) == 0) {
                         IP_STATINC(IP_STAT_BADADDR);                          IP_STATINC(IP_STAT_BADADDR);
                         goto bad;                          goto out;
                 }                  }
         }          }
   
Line 458  ip_input(struct mbuf *m)
Line 540  ip_input(struct mbuf *m)
                  M_CSUM_IPv4_BAD)) {                   M_CSUM_IPv4_BAD)) {
         case M_CSUM_IPv4|M_CSUM_IPv4_BAD:          case M_CSUM_IPv4|M_CSUM_IPv4_BAD:
                 INET_CSUM_COUNTER_INCR(&ip_hwcsum_bad);                  INET_CSUM_COUNTER_INCR(&ip_hwcsum_bad);
                 goto badcsum;                  IP_STATINC(IP_STAT_BADSUM);
                   goto out;
   
         case M_CSUM_IPv4:          case M_CSUM_IPv4:
                 /* Checksum was okay. */                  /* Checksum was okay. */
Line 473  ip_input(struct mbuf *m)
Line 556  ip_input(struct mbuf *m)
                 if (__predict_true(!(ifp->if_flags & IFF_LOOPBACK) ||                  if (__predict_true(!(ifp->if_flags & IFF_LOOPBACK) ||
                     ip_do_loopback_cksum)) {                      ip_do_loopback_cksum)) {
                         INET_CSUM_COUNTER_INCR(&ip_swcsum);                          INET_CSUM_COUNTER_INCR(&ip_swcsum);
                         if (in_cksum(m, hlen) != 0)                          if (in_cksum(m, hlen) != 0) {
                                 goto badcsum;                                  IP_STATINC(IP_STAT_BADSUM);
                                   goto out;
                           }
                 }                  }
                 break;                  break;
         }          }
Line 487  ip_input(struct mbuf *m)
Line 572  ip_input(struct mbuf *m)
          */           */
         if (len < hlen) {          if (len < hlen) {
                 IP_STATINC(IP_STAT_BADLEN);                  IP_STATINC(IP_STAT_BADLEN);
                 goto bad;                  goto out;
         }          }
   
         /*          /*
Line 498  ip_input(struct mbuf *m)
Line 583  ip_input(struct mbuf *m)
          */           */
         if (m->m_pkthdr.len < len) {          if (m->m_pkthdr.len < len) {
                 IP_STATINC(IP_STAT_TOOSHORT);                  IP_STATINC(IP_STAT_TOOSHORT);
                 goto bad;                  goto out;
         }          }
         if (m->m_pkthdr.len > len) {          if (m->m_pkthdr.len > len) {
                 if (m->m_len == m->m_pkthdr.len) {                  if (m->m_len == m->m_pkthdr.len) {
Line 522  ip_input(struct mbuf *m)
Line 607  ip_input(struct mbuf *m)
          * in the list may have previously cleared it.           * in the list may have previously cleared it.
          */           */
 #if defined(IPSEC)  #if defined(IPSEC)
         if (!ipsec_indone(m))          if (!ipsec_used || !ipsec_indone(m))
 #else  #else
         if (1)          if (1)
 #endif  #endif
         {          {
                 struct in_addr odst = ip->ip_dst;                  struct in_addr odst = ip->ip_dst;
                   bool freed;
   
                 if (pfil_run_hooks(inet_pfil_hook, &m, ifp, PFIL_IN) != 0)                  freed = pfil_run_hooks(inet_pfil_hook, &m, ifp, PFIL_IN) != 0;
                         return;                  if (freed || m == NULL) {
                 if (m == NULL)                          m = NULL;
                         return;                          goto out;
                   }
                 ip = mtod(m, struct ip *);                  ip = mtod(m, struct ip *);
                 hlen = ip->ip_hl << 2;                  hlen = ip->ip_hl << 2;
   
                 /*                  /*
                  * XXX The setting of "srcrt" here is to prevent ip_forward()                   * XXX The setting of "srcrt" here is to prevent ip_forward()
                  * from generating ICMP redirects for packets that have                   * from generating ICMP redirects for packets that have
Line 554  ip_input(struct mbuf *m)
Line 642  ip_input(struct mbuf *m)
   
 #ifdef ALTQ  #ifdef ALTQ
         /* XXX Temporary until ALTQ is changed to use a pfil hook */          /* XXX Temporary until ALTQ is changed to use a pfil hook */
         if (altq_input != NULL && (*altq_input)(m, AF_INET) == 0) {          if (altq_input) {
                 /* packet dropped by traffic conditioner */                  SOFTNET_LOCK();
                 return;                  if ((*altq_input)(m, AF_INET) == 0) {
                           /* Packet dropped by traffic conditioner. */
                           SOFTNET_UNLOCK();
                           m = NULL;
                           goto out;
                   }
                   SOFTNET_UNLOCK();
         }          }
 #endif  #endif
   
Line 566  ip_input(struct mbuf *m)
Line 660  ip_input(struct mbuf *m)
          * error was detected (causing an icmp message           * error was detected (causing an icmp message
          * to be sent and the original packet to be freed).           * to be sent and the original packet to be freed).
          */           */
         ip_nhops = 0;           /* for source routed packets */          if (hlen > sizeof (struct ip) && ip_dooptions(m)) {
         if (hlen > sizeof (struct ip) && ip_dooptions(m))                  m = NULL;
                 return;                  goto out;
           }
         /*  
          * Enable a consistency check between the destination address  
          * and the arrival interface for a unicast packet (the RFC 1122  
          * strong ES model) if IP forwarding is disabled and the packet  
          * is not locally generated.  
          *  
          * XXX - Checking also should be disabled if the destination  
          * address is ipnat'ed to a different interface.  
          *  
          * XXX - Checking is incompatible with IP aliases added  
          * to the loopback interface instead of the interface where  
          * the packets are received.  
          *  
          * XXX - We need to add a per ifaddr flag for this so that  
          * we get finer grain control.  
          */  
         checkif = ip_checkinterface && (ipforwarding == 0) &&  
             ifp && (ifp->if_flags & IFF_LOOPBACK) == 0;  
   
         /*          /*
          * Check our list of addresses, to see if the packet is for us.           * Check our list of addresses, to see if the packet is for us.
          *           *
          * Traditional 4.4BSD did not consult IFF_UP at all.           * Traditional 4.4BSD did not consult IFF_UP at all.
          * The behavior here is to treat addresses on !IFF_UP interface           * The behavior here is to treat addresses on !IFF_UP interface
          * as not mine.           * or IN_IFF_NOTREADY addresses as not mine.
          */           */
         downmatch = 0;          downmatch = 0;
         LIST_FOREACH(ia, &IN_IFADDR_HASH(ip->ip_dst.s_addr), ia_hash) {          s = pserialize_read_enter();
                 if (in_hosteq(ia->ia_addr.sin_addr, ip->ip_dst)) {          ia = ip_match_our_address(ifp, ip, &downmatch);
                         if (checkif && ia->ia_ifp != ifp)          if (ia != NULL) {
                                 continue;                  pserialize_read_exit(s);
                         if ((ia->ia_ifp->if_flags & IFF_UP) != 0)  
                                 break;  
                         else  
                                 downmatch++;  
                 }  
         }  
         if (ia != NULL)  
                 goto ours;                  goto ours;
         if (ifp && ifp->if_flags & IFF_BROADCAST) {          }
                 IFADDR_FOREACH(ifa, ifp) {  
                         if (ifa->ifa_addr->sa_family != AF_INET)          if (ifp->if_flags & IFF_BROADCAST) {
                                 continue;                  ia = ip_match_our_address_broadcast(ifp, ip);
                         ia = ifatoia(ifa);                  if (ia != NULL) {
                         if (in_hosteq(ip->ip_dst, ia->ia_broadaddr.sin_addr) ||                          pserialize_read_exit(s);
                             in_hosteq(ip->ip_dst, ia->ia_netbroadcast) ||                          goto ours;
                             /*  
                              * Look for all-0's host part (old broadcast addr),  
                              * either for subnet or net.  
                              */  
                             ip->ip_dst.s_addr == ia->ia_subnet ||  
                             ip->ip_dst.s_addr == ia->ia_net)  
                                 goto ours;  
                         /*  
                          * An interface with IP address zero accepts  
                          * all packets that arrive on that interface.  
                          */  
                         if (in_nullhost(ia->ia_addr.sin_addr))  
                                 goto ours;  
                 }                  }
         }          }
           pserialize_read_exit(s);
   
         if (IN_MULTICAST(ip->ip_dst.s_addr)) {          if (IN_MULTICAST(ip->ip_dst.s_addr)) {
                 struct in_multi *inm;  
 #ifdef MROUTING  #ifdef MROUTING
                 extern struct socket *ip_mrouter;                  extern struct socket *ip_mrouter;
   
Line 649  ip_input(struct mbuf *m)
Line 706  ip_input(struct mbuf *m)
                          * as expected when ip_mforward() is called from                           * as expected when ip_mforward() is called from
                          * ip_output().)                           * ip_output().)
                          */                           */
                           SOFTNET_LOCK();
                         if (ip_mforward(m, ifp) != 0) {                          if (ip_mforward(m, ifp) != 0) {
                                   SOFTNET_UNLOCK();
                                 IP_STATINC(IP_STAT_CANTFORWARD);                                  IP_STATINC(IP_STAT_CANTFORWARD);
                                 m_freem(m);                                  goto out;
                                 return;  
                         }                          }
                           SOFTNET_UNLOCK();
   
                         /*                          /*
                          * The process-level routing demon needs to receive                           * The process-level routing demon needs to receive
                          * all multicast IGMP packets, whether or not this                           * all multicast IGMP packets, whether or not this
                          * host belongs to their destination groups.                           * host belongs to their destination groups.
                          */                           */
                         if (ip->ip_p == IPPROTO_IGMP)                          if (ip->ip_p == IPPROTO_IGMP) {
                                 goto ours;                                  goto ours;
                           }
                         IP_STATINC(IP_STAT_CANTFORWARD);                          IP_STATINC(IP_STAT_CANTFORWARD);
                 }                  }
 #endif  #endif
Line 669  ip_input(struct mbuf *m)
Line 729  ip_input(struct mbuf *m)
                  * See if we belong to the destination multicast group on the                   * See if we belong to the destination multicast group on the
                  * arrival interface.                   * arrival interface.
                  */                   */
                 IN_LOOKUP_MULTI(ip->ip_dst, ifp, inm);                  if (!in_multi_group(ip->ip_dst, ifp, 0)) {
                 if (inm == NULL) {  
                         IP_STATINC(IP_STAT_CANTFORWARD);                          IP_STATINC(IP_STAT_CANTFORWARD);
                         m_freem(m);                          goto out;
                         return;  
                 }                  }
                 goto ours;                  goto ours;
         }          }
Line 685  ip_input(struct mbuf *m)
Line 743  ip_input(struct mbuf *m)
          * Not for us; forward if possible and desirable.           * Not for us; forward if possible and desirable.
          */           */
         if (ipforwarding == 0) {          if (ipforwarding == 0) {
                   m_put_rcvif_psref(ifp, &psref);
                 IP_STATINC(IP_STAT_CANTFORWARD);                  IP_STATINC(IP_STAT_CANTFORWARD);
                 m_freem(m);                  m_freem(m);
         } else {          } else {
Line 695  ip_input(struct mbuf *m)
Line 754  ip_input(struct mbuf *m)
                  * forwarding loop till TTL goes to 0.                   * forwarding loop till TTL goes to 0.
                  */                   */
                 if (downmatch) {                  if (downmatch) {
                           m_put_rcvif_psref(ifp, &psref);
                         icmp_error(m, ICMP_UNREACH, ICMP_UNREACH_HOST, 0, 0);                          icmp_error(m, ICMP_UNREACH, ICMP_UNREACH_HOST, 0, 0);
                         IP_STATINC(IP_STAT_CANTFORWARD);                          IP_STATINC(IP_STAT_CANTFORWARD);
                         return;                          return;
                 }                  }
 #ifdef IPSEC  #ifdef IPSEC
                 /* Perform IPsec, if any. */                  /* Check the security policy (SP) for the packet */
                 if (ipsec4_input(m, IP_FORWARDING | (ip_directedbcast ?                  if (ipsec_used) {
                     IP_ALLOWBROADCAST : 0)) != 0) {                          if (ipsec4_input(m, IP_FORWARDING |
                         goto bad;                              (ip_directedbcast ? IP_ALLOWBROADCAST : 0)) != 0) {
                                   goto out;
                           }
                 }                  }
 #endif  #endif
                 ip_forward(m, srcrt);                  ip_forward(m, srcrt, ifp);
                   m_put_rcvif_psref(ifp, &psref);
         }          }
         return;          return;
   
 ours:  ours:
           m_put_rcvif_psref(ifp, &psref);
           ifp = NULL;
   
         /*          /*
          * If offset or IP_MF are set, must reassemble.           * If offset or IP_MF are set, must reassemble.
          */           */
Line 720  ours:
Line 786  ours:
                  */                   */
                 if (ip_reass_packet(&m, ip) != 0) {                  if (ip_reass_packet(&m, ip) != 0) {
                         /* Failed; invalid fragment(s) or packet. */                          /* Failed; invalid fragment(s) or packet. */
                         goto bad;                          goto out;
                 }                  }
                 if (m == NULL) {                  if (m == NULL) {
                         /* More fragments should come; silently return. */                          /* More fragments should come; silently return. */
                         return;                          goto out;
                 }                  }
                 /*                  /*
                  * Reassembly is done, we have the final packet.                   * Reassembly is done, we have the final packet.
Line 740  ours:
Line 806  ours:
          * Note that we do not visit this with protocols with PCB layer           * Note that we do not visit this with protocols with PCB layer
          * code - like UDP/TCP/raw IP.           * code - like UDP/TCP/raw IP.
          */           */
         if ((inetsw[ip_protox[ip->ip_p]].pr_flags & PR_LASTHDR) != 0) {          if (ipsec_used &&
               (inetsw[ip_protox[ip->ip_p]].pr_flags & PR_LASTHDR) != 0) {
                 if (ipsec4_input(m, 0) != 0) {                  if (ipsec4_input(m, 0) != 0) {
                         goto bad;                          goto out;
                 }                  }
         }          }
 #endif  #endif
Line 751  ours:
Line 818  ours:
          * Switch out to protocol's input routine.           * Switch out to protocol's input routine.
          */           */
 #if IFA_STATS  #if IFA_STATS
         if (ia && ip)          if (ia && ip) {
                 ia->ia_ifa.ifa_data.ifad_inbytes += ntohs(ip->ip_len);                  struct in_ifaddr *_ia;
                   /*
                    * Keep a reference from ip_match_our_address with psref
                    * is expensive, so explore ia here again.
                    */
                   s = pserialize_read_enter();
                   _ia = in_get_ia(ip->ip_dst);
                   _ia->ia_ifa.ifa_data.ifad_inbytes += ntohs(ip->ip_len);
                   pserialize_read_exit(s);
           }
 #endif  #endif
         IP_STATINC(IP_STAT_DELIVERED);          IP_STATINC(IP_STAT_DELIVERED);
     {  
         int off = hlen, nh = ip->ip_p;          const int off = hlen, nh = ip->ip_p;
   
         (*inetsw[ip_protox[nh]].pr_input)(m, off, nh);          (*inetsw[ip_protox[nh]].pr_input)(m, off, nh);
         return;          return;
     }  
 bad:  
         m_freem(m);  
         return;  
   
 badcsum:  out:
         IP_STATINC(IP_STAT_BADSUM);          m_put_rcvif_psref(ifp, &psref);
         m_freem(m);          if (m != NULL)
                   m_freem(m);
 }  }
   
 /*  /*
Line 777  void
Line 850  void
 ip_slowtimo(void)  ip_slowtimo(void)
 {  {
   
         mutex_enter(softnet_lock);          SOFTNET_KERNEL_LOCK_UNLESS_NET_MPSAFE();
         KERNEL_LOCK(1, NULL);  
   
         ip_reass_slowtimo();          ip_reass_slowtimo();
   
         KERNEL_UNLOCK_ONE(NULL);          SOFTNET_KERNEL_UNLOCK_UNLESS_NET_MPSAFE();
         mutex_exit(softnet_lock);  
 }  }
   
 /*  /*
Line 815  ip_dooptions(struct mbuf *m)
Line 886  ip_dooptions(struct mbuf *m)
         int opt, optlen, cnt, off, code, type = ICMP_PARAMPROB, forward = 0;          int opt, optlen, cnt, off, code, type = ICMP_PARAMPROB, forward = 0;
         struct in_addr dst;          struct in_addr dst;
         n_time ntime;          n_time ntime;
           struct ifaddr *ifa = NULL;
           int s;
   
         dst = ip->ip_dst;          dst = ip->ip_dst;
         cp = (u_char *)(ip + 1);          cp = (u_char *)(ip + 1);
Line 851  ip_dooptions(struct mbuf *m)
Line 924  ip_dooptions(struct mbuf *m)
                  * address is on directly accessible net.                   * address is on directly accessible net.
                  */                   */
                 case IPOPT_LSRR:                  case IPOPT_LSRR:
                 case IPOPT_SSRR:                  case IPOPT_SSRR: {
                           struct psref psref;
                           struct sockaddr_in ipaddr = {
                               .sin_len = sizeof(ipaddr),
                               .sin_family = AF_INET,
                           };
   
                         if (ip_allowsrcrt == 0) {                          if (ip_allowsrcrt == 0) {
                                 type = ICMP_UNREACH;                                  type = ICMP_UNREACH;
                                 code = ICMP_UNREACH_NET_PROHIB;                                  code = ICMP_UNREACH_NET_PROHIB;
Line 866  ip_dooptions(struct mbuf *m)
Line 945  ip_dooptions(struct mbuf *m)
                                 goto bad;                                  goto bad;
                         }                          }
                         ipaddr.sin_addr = ip->ip_dst;                          ipaddr.sin_addr = ip->ip_dst;
                         ia = ifatoia(ifa_ifwithaddr(sintosa(&ipaddr)));  
                         if (ia == 0) {                          s = pserialize_read_enter();
                           ifa = ifa_ifwithaddr(sintosa(&ipaddr));
                           if (ifa == NULL) {
                                   pserialize_read_exit(s);
                                 if (opt == IPOPT_SSRR) {                                  if (opt == IPOPT_SSRR) {
                                         type = ICMP_UNREACH;                                          type = ICMP_UNREACH;
                                         code = ICMP_UNREACH_SRCFAIL;                                          code = ICMP_UNREACH_SRCFAIL;
Line 879  ip_dooptions(struct mbuf *m)
Line 961  ip_dooptions(struct mbuf *m)
                                  */                                   */
                                 break;                                  break;
                         }                          }
                           pserialize_read_exit(s);
   
                         off--;                  /* 0 origin */                          off--;                  /* 0 origin */
                         if ((off + sizeof(struct in_addr)) > optlen) {                          if ((off + sizeof(struct in_addr)) > optlen) {
                                 /*                                  /*
                                  * End of source route.  Should be for us.                                   * End of source route.  Should be for us.
                                  */                                   */
                                 save_rte(cp, ip->ip_src);                                  save_rte(m, cp, ip->ip_src);
                                 break;                                  break;
                         }                          }
                         /*                          /*
Line 892  ip_dooptions(struct mbuf *m)
Line 976  ip_dooptions(struct mbuf *m)
                          */                           */
                         memcpy((void *)&ipaddr.sin_addr, (void *)(cp + off),                          memcpy((void *)&ipaddr.sin_addr, (void *)(cp + off),
                             sizeof(ipaddr.sin_addr));                              sizeof(ipaddr.sin_addr));
                         if (opt == IPOPT_SSRR)                          if (opt == IPOPT_SSRR) {
                                 ia = ifatoia(ifa_ifwithladdr(sintosa(&ipaddr)));                                  ifa = ifa_ifwithladdr_psref(sintosa(&ipaddr),
                         else                                      &psref);
                                 ia = ip_rtaddr(ipaddr.sin_addr);                                  if (ifa != NULL)
                         if (ia == 0) {                                          ia = ifatoia(ifa);
                                   else
                                           ia = NULL;
                           } else {
                                   ia = ip_rtaddr(ipaddr.sin_addr, &psref);
                           }
                           if (ia == NULL) {
                                 type = ICMP_UNREACH;                                  type = ICMP_UNREACH;
                                 code = ICMP_UNREACH_SRCFAIL;                                  code = ICMP_UNREACH_SRCFAIL;
                                 goto bad;                                  goto bad;
Line 904  ip_dooptions(struct mbuf *m)
Line 994  ip_dooptions(struct mbuf *m)
                         ip->ip_dst = ipaddr.sin_addr;                          ip->ip_dst = ipaddr.sin_addr;
                         bcopy((void *)&ia->ia_addr.sin_addr,                          bcopy((void *)&ia->ia_addr.sin_addr,
                             (void *)(cp + off), sizeof(struct in_addr));                              (void *)(cp + off), sizeof(struct in_addr));
                           ia4_release(ia, &psref);
                         cp[IPOPT_OFFSET] += sizeof(struct in_addr);                          cp[IPOPT_OFFSET] += sizeof(struct in_addr);
                         /*                          /*
                          * Let ip_intr's mcast routing check handle mcast pkts                           * Let ip_intr's mcast routing check handle mcast pkts
                          */                           */
                         forward = !IN_MULTICAST(ip->ip_dst.s_addr);                          forward = !IN_MULTICAST(ip->ip_dst.s_addr);
                         break;                          break;
                       }
   
                   case IPOPT_RR: {
                           struct psref psref;
                           struct sockaddr_in ipaddr = {
                               .sin_len = sizeof(ipaddr),
                               .sin_family = AF_INET,
                           };
   
                 case IPOPT_RR:  
                         if (optlen < IPOPT_OFFSET + sizeof(*cp)) {                          if (optlen < IPOPT_OFFSET + sizeof(*cp)) {
                                 code = &cp[IPOPT_OLEN] - (u_char *)ip;                                  code = &cp[IPOPT_OLEN] - (u_char *)ip;
                                 goto bad;                                  goto bad;
Line 932  ip_dooptions(struct mbuf *m)
Line 1030  ip_dooptions(struct mbuf *m)
                          * locate outgoing interface; if we're the destination,                           * locate outgoing interface; if we're the destination,
                          * use the incoming interface (should be same).                           * use the incoming interface (should be same).
                          */                           */
                         if ((ia = ifatoia(ifa_ifwithaddr(sintosa(&ipaddr))))                          ifa = ifa_ifwithaddr_psref(sintosa(&ipaddr), &psref);
                             == NULL &&                          if (ifa == NULL) {
                             (ia = ip_rtaddr(ipaddr.sin_addr)) == NULL) {                                  ia = ip_rtaddr(ipaddr.sin_addr, &psref);
                                 type = ICMP_UNREACH;                                  if (ia == NULL) {
                                 code = ICMP_UNREACH_HOST;                                          type = ICMP_UNREACH;
                                 goto bad;                                          code = ICMP_UNREACH_HOST;
                                           goto bad;
                                   }
                           } else {
                                   ia = ifatoia(ifa);
                         }                          }
                         bcopy((void *)&ia->ia_addr.sin_addr,                          bcopy((void *)&ia->ia_addr.sin_addr,
                             (void *)(cp + off), sizeof(struct in_addr));                              (void *)(cp + off), sizeof(struct in_addr));
                           ia4_release(ia, &psref);
                         cp[IPOPT_OFFSET] += sizeof(struct in_addr);                          cp[IPOPT_OFFSET] += sizeof(struct in_addr);
                         break;                          break;
                       }
   
                 case IPOPT_TS:                  case IPOPT_TS:
                         code = cp - (u_char *)ip;                          code = cp - (u_char *)ip;
Line 969  ip_dooptions(struct mbuf *m)
Line 1073  ip_dooptions(struct mbuf *m)
                         case IPOPT_TS_TSONLY:                          case IPOPT_TS_TSONLY:
                                 break;                                  break;
   
                         case IPOPT_TS_TSANDADDR:                          case IPOPT_TS_TSANDADDR: {
                                   struct ifnet *rcvif;
                                   int _s, _ss;
                                   struct sockaddr_in ipaddr = {
                                       .sin_len = sizeof(ipaddr),
                                       .sin_family = AF_INET,
                                   };
   
                                 if (ipt->ipt_ptr - 1 + sizeof(n_time) +                                  if (ipt->ipt_ptr - 1 + sizeof(n_time) +
                                     sizeof(struct in_addr) > ipt->ipt_len) {                                      sizeof(struct in_addr) > ipt->ipt_len) {
                                         code = (u_char *)&ipt->ipt_ptr -                                          code = (u_char *)&ipt->ipt_ptr -
Line 977  ip_dooptions(struct mbuf *m)
Line 1088  ip_dooptions(struct mbuf *m)
                                         goto bad;                                          goto bad;
                                 }                                  }
                                 ipaddr.sin_addr = dst;                                  ipaddr.sin_addr = dst;
                                 ia = ifatoia(ifaof_ifpforaddr(sintosa(&ipaddr),                                  _ss = pserialize_read_enter();
                                     m->m_pkthdr.rcvif));                                  rcvif = m_get_rcvif(m, &_s);
                                 if (ia == 0)                                  if (__predict_true(rcvif != NULL)) {
                                         continue;                                          ifa = ifaof_ifpforaddr(sintosa(&ipaddr),
                                               rcvif);
                                   }
                                   m_put_rcvif(rcvif, &_s);
                                   if (ifa == NULL) {
                                           pserialize_read_exit(_ss);
                                           break;
                                   }
                                   ia = ifatoia(ifa);
                                 bcopy(&ia->ia_addr.sin_addr,                                  bcopy(&ia->ia_addr.sin_addr,
                                     cp0, sizeof(struct in_addr));                                      cp0, sizeof(struct in_addr));
                                   pserialize_read_exit(_ss);
                                 ipt->ipt_ptr += sizeof(struct in_addr);                                  ipt->ipt_ptr += sizeof(struct in_addr);
                                 break;                                  break;
                           }
   
                           case IPOPT_TS_PRESPEC: {
                                   struct sockaddr_in ipaddr = {
                                       .sin_len = sizeof(ipaddr),
                                       .sin_family = AF_INET,
                                   };
   
                         case IPOPT_TS_PRESPEC:  
                                 if (ipt->ipt_ptr - 1 + sizeof(n_time) +                                  if (ipt->ipt_ptr - 1 + sizeof(n_time) +
                                     sizeof(struct in_addr) > ipt->ipt_len) {                                      sizeof(struct in_addr) > ipt->ipt_len) {
                                         code = (u_char *)&ipt->ipt_ptr -                                          code = (u_char *)&ipt->ipt_ptr -
Line 995  ip_dooptions(struct mbuf *m)
Line 1121  ip_dooptions(struct mbuf *m)
                                 }                                  }
                                 memcpy(&ipaddr.sin_addr, cp0,                                  memcpy(&ipaddr.sin_addr, cp0,
                                     sizeof(struct in_addr));                                      sizeof(struct in_addr));
                                 if (ifatoia(ifa_ifwithaddr(sintosa(&ipaddr)))                                  s = pserialize_read_enter();
                                     == NULL)                                  ifa = ifa_ifwithaddr(sintosa(&ipaddr));
                                   if (ifa == NULL) {
                                           pserialize_read_exit(s);
                                         continue;                                          continue;
                                   }
                                   pserialize_read_exit(s);
                                 ipt->ipt_ptr += sizeof(struct in_addr);                                  ipt->ipt_ptr += sizeof(struct in_addr);
                                 break;                                  break;
                               }
   
                         default:                          default:
                                 /* XXX can't take &ipt->ipt_flg */                                  /* XXX can't take &ipt->ipt_flg */
Line 1015  ip_dooptions(struct mbuf *m)
Line 1146  ip_dooptions(struct mbuf *m)
                 }                  }
         }          }
         if (forward) {          if (forward) {
                   struct ifnet *rcvif;
                   struct psref _psref;
   
                 if (ip_forwsrcrt == 0) {                  if (ip_forwsrcrt == 0) {
                         type = ICMP_UNREACH;                          type = ICMP_UNREACH;
                         code = ICMP_UNREACH_SRCFAIL;                          code = ICMP_UNREACH_SRCFAIL;
                         goto bad;                          goto bad;
                 }                  }
                 ip_forward(m, 1);  
                   rcvif = m_get_rcvif_psref(m, &_psref);
                   if (__predict_false(rcvif == NULL)) {
                           type = ICMP_UNREACH;
                           code = ICMP_UNREACH_HOST;
                           goto bad;
                   }
                   ip_forward(m, 1, rcvif);
                   m_put_rcvif_psref(rcvif, &_psref);
                 return true;                  return true;
         }          }
         return false;          return false;
Line 1035  bad:
Line 1177  bad:
  * return internet address info of interface to be used to get there.   * return internet address info of interface to be used to get there.
  */   */
 static struct in_ifaddr *  static struct in_ifaddr *
 ip_rtaddr(struct in_addr dst)  ip_rtaddr(struct in_addr dst, struct psref *psref)
 {  {
         struct rtentry *rt;          struct rtentry *rt;
         union {          union {
                 struct sockaddr         dst;                  struct sockaddr         dst;
                 struct sockaddr_in      dst4;                  struct sockaddr_in      dst4;
         } u;          } u;
           struct route *ro;
   
         sockaddr_in_init(&u.dst4, &dst, 0);          sockaddr_in_init(&u.dst4, &dst, 0);
   
         if ((rt = rtcache_lookup(&ipforward_rt, &u.dst)) == NULL)          ro = percpu_getref(ipforward_rt_percpu);
           rt = rtcache_lookup(ro, &u.dst);
           if (rt == NULL) {
                   percpu_putref(ipforward_rt_percpu);
                 return NULL;                  return NULL;
           }
   
           ia4_acquire(ifatoia(rt->rt_ifa), psref);
           rtcache_unref(rt, ro);
           percpu_putref(ipforward_rt_percpu);
   
         return ifatoia(rt->rt_ifa);          return ifatoia(rt->rt_ifa);
 }  }
Line 1056  ip_rtaddr(struct in_addr dst)
Line 1207  ip_rtaddr(struct in_addr dst)
  * up later by ip_srcroute if the receiver is interested.   * up later by ip_srcroute if the receiver is interested.
  */   */
 static void  static void
 save_rte(u_char *option, struct in_addr dst)  save_rte(struct mbuf *m, u_char *option, struct in_addr dst)
 {  {
           struct ip_srcrt *isr;
           struct m_tag *mtag;
         unsigned olen;          unsigned olen;
   
         olen = option[IPOPT_OLEN];          olen = option[IPOPT_OLEN];
         if (olen > sizeof(ip_srcrt) - (1 + sizeof(dst)))          if (olen > sizeof(isr->isr_hdr) + sizeof(isr->isr_routes))
                   return;
   
           mtag = m_tag_get(PACKET_TAG_SRCROUTE, sizeof(*isr), M_NOWAIT);
           if (mtag == NULL)
                 return;                  return;
         memcpy((void *)ip_srcrt.srcopt, (void *)option, olen);          isr = (struct ip_srcrt *)(mtag + 1);
         ip_nhops = (olen - IPOPT_OFFSET - 1) / sizeof(struct in_addr);  
         ip_srcrt.dst = dst;          memcpy(isr->isr_hdr, option, olen);
           isr->isr_nhops = (olen - IPOPT_OFFSET - 1) / sizeof(struct in_addr);
           isr->isr_dst = dst;
           m_tag_prepend(m, mtag);
 }  }
   
 /*  /*
Line 1074  save_rte(u_char *option, struct in_addr 
Line 1234  save_rte(u_char *option, struct in_addr 
  * The first hop is placed before the options, will be removed later.   * The first hop is placed before the options, will be removed later.
  */   */
 struct mbuf *  struct mbuf *
 ip_srcroute(void)  ip_srcroute(struct mbuf *m0)
 {  {
         struct in_addr *p, *q;          struct in_addr *p, *q;
         struct mbuf *m;          struct mbuf *m;
           struct ip_srcrt *isr;
           struct m_tag *mtag;
   
           mtag = m_tag_find(m0, PACKET_TAG_SRCROUTE, NULL);
           if (mtag == NULL)
                   return NULL;
           isr = (struct ip_srcrt *)(mtag + 1);
   
         if (ip_nhops == 0)          if (isr->isr_nhops == 0)
                 return NULL;                  return NULL;
   
         m = m_get(M_DONTWAIT, MT_SOOPTS);          m = m_get(M_DONTWAIT, MT_SOOPTS);
         if (m == 0)          if (m == NULL)
                 return NULL;                  return NULL;
   
         MCLAIM(m, &inetdomain.dom_mowner);          MCLAIM(m, &inetdomain.dom_mowner);
 #define OPTSIZ  (sizeof(ip_srcrt.nop) + sizeof(ip_srcrt.srcopt))  #define OPTSIZ  (sizeof(isr->isr_nop) + sizeof(isr->isr_hdr))
   
         /* length is (nhops+1)*sizeof(addr) + sizeof(nop + srcrt header) */          /* length is (nhops+1)*sizeof(addr) + sizeof(nop + header) */
         m->m_len = ip_nhops * sizeof(struct in_addr) + sizeof(struct in_addr) +          m->m_len = (isr->isr_nhops + 1) * sizeof(struct in_addr) + OPTSIZ;
             OPTSIZ;  
   
         /*          /*
          * First save first hop for return route           * First save first hop for return route
          */           */
         p = &ip_srcrt.route[ip_nhops - 1];          p = &(isr->isr_routes[isr->isr_nhops - 1]);
         *(mtod(m, struct in_addr *)) = *p--;          *(mtod(m, struct in_addr *)) = *p--;
   
         /*          /*
          * Copy option fields and padding (nop) to mbuf.           * Copy option fields and padding (nop) to mbuf.
          */           */
         ip_srcrt.nop = IPOPT_NOP;          isr->isr_nop = IPOPT_NOP;
         ip_srcrt.srcopt[IPOPT_OFFSET] = IPOPT_MINOFF;          isr->isr_hdr[IPOPT_OFFSET] = IPOPT_MINOFF;
         memmove(mtod(m, char *) + sizeof(struct in_addr), &ip_srcrt.nop,          memmove(mtod(m, char *) + sizeof(struct in_addr), &isr->isr_nop,
             OPTSIZ);              OPTSIZ);
         q = (struct in_addr *)(mtod(m, char *) +          q = (struct in_addr *)(mtod(m, char *) +
             sizeof(struct in_addr) + OPTSIZ);              sizeof(struct in_addr) + OPTSIZ);
Line 1112  ip_srcroute(void)
Line 1279  ip_srcroute(void)
          * Record return path as an IP source route,           * Record return path as an IP source route,
          * reversing the path (pointers are now aligned).           * reversing the path (pointers are now aligned).
          */           */
         while (p >= ip_srcrt.route) {          while (p >= isr->isr_routes) {
                 *q++ = *p--;                  *q++ = *p--;
         }          }
         /*          /*
          * Last hop goes to final destination.           * Last hop goes to final destination.
          */           */
         *q = ip_srcrt.dst;          *q = isr->isr_dst;
         return (m);          m_tag_delete(m0, mtag);
           return m;
 }  }
   
 const int inetctlerrmap[PRC_NCMDS] = {  const int inetctlerrmap[PRC_NCMDS] = {
Line 1164  ip_drainstub(void)
Line 1332  ip_drainstub(void)
  * via a source route.   * via a source route.
  */   */
 static void  static void
 ip_forward(struct mbuf *m, int srcrt)  ip_forward(struct mbuf *m, int srcrt, struct ifnet *rcvif)
 {  {
         struct ip *ip = mtod(m, struct ip *);          struct ip *ip = mtod(m, struct ip *);
         struct rtentry *rt;          struct rtentry *rt;
Line 1175  ip_forward(struct mbuf *m, int srcrt)
Line 1343  ip_forward(struct mbuf *m, int srcrt)
                 struct sockaddr         dst;                  struct sockaddr         dst;
                 struct sockaddr_in      dst4;                  struct sockaddr_in      dst4;
         } u;          } u;
           uint64_t *ips;
           struct route *ro;
   
           KASSERTMSG(cpu_softintr_p(), "ip_forward: not in the software "
               "interrupt handler; synchronization assumptions violated");
   
         /*          /*
          * We are now in the output path.           * We are now in the output path.
Line 1192  ip_forward(struct mbuf *m, int srcrt)
Line 1365  ip_forward(struct mbuf *m, int srcrt)
                 m_freem(m);                  m_freem(m);
                 return;                  return;
         }          }
   
         if (ip->ip_ttl <= IPTTLDEC) {          if (ip->ip_ttl <= IPTTLDEC) {
                 icmp_error(m, ICMP_TIMXCEED, ICMP_TIMXCEED_INTRANS, dest, 0);                  icmp_error(m, ICMP_TIMXCEED, ICMP_TIMXCEED_INTRANS, dest, 0);
                 return;                  return;
         }          }
   
         sockaddr_in_init(&u.dst4, &ip->ip_dst, 0);          sockaddr_in_init(&u.dst4, &ip->ip_dst, 0);
         if ((rt = rtcache_lookup(&ipforward_rt, &u.dst)) == NULL) {  
           ro = percpu_getref(ipforward_rt_percpu);
           rt = rtcache_lookup(ro, &u.dst);
           if (rt == NULL) {
                   percpu_putref(ipforward_rt_percpu);
                 icmp_error(m, ICMP_UNREACH, ICMP_UNREACH_NET, dest, 0);                  icmp_error(m, ICMP_UNREACH, ICMP_UNREACH_NET, dest, 0);
                 return;                  return;
         }          }
Line 1222  ip_forward(struct mbuf *m, int srcrt)
Line 1400  ip_forward(struct mbuf *m, int srcrt)
          * Also, don't send redirect if forwarding using a default route           * Also, don't send redirect if forwarding using a default route
          * or a route modified by a redirect.           * or a route modified by a redirect.
          */           */
         if (rt->rt_ifp == m->m_pkthdr.rcvif &&          if (rt->rt_ifp == rcvif &&
             (rt->rt_flags & (RTF_DYNAMIC|RTF_MODIFIED)) == 0 &&              (rt->rt_flags & (RTF_DYNAMIC|RTF_MODIFIED)) == 0 &&
             !in_nullhost(satocsin(rt_getkey(rt))->sin_addr) &&              !in_nullhost(satocsin(rt_getkey(rt))->sin_addr) &&
             ipsendredirects && !srcrt) {              ipsendredirects && !srcrt) {
Line 1241  ip_forward(struct mbuf *m, int srcrt)
Line 1419  ip_forward(struct mbuf *m, int srcrt)
                         code = ICMP_REDIRECT_HOST;                          code = ICMP_REDIRECT_HOST;
                 }                  }
         }          }
           rtcache_unref(rt, ro);
   
         error = ip_output(m, NULL, &ipforward_rt,          error = ip_output(m, NULL, ro,
             (IP_FORWARDING | (ip_directedbcast ? IP_ALLOWBROADCAST : 0)),              (IP_FORWARDING | (ip_directedbcast ? IP_ALLOWBROADCAST : 0)),
             NULL, NULL);              NULL, NULL);
   
         if (error)          if (error) {
                 IP_STATINC(IP_STAT_CANTFORWARD);                  IP_STATINC(IP_STAT_CANTFORWARD);
         else {                  goto error;
                 uint64_t *ips = IP_STAT_GETREF();          }
                 ips[IP_STAT_FORWARD]++;  
                 if (type) {          ips = IP_STAT_GETREF();
                         ips[IP_STAT_REDIRECTSENT]++;          ips[IP_STAT_FORWARD]++;
                         IP_STAT_PUTREF();  
                 } else {          if (type) {
                         IP_STAT_PUTREF();                  ips[IP_STAT_REDIRECTSENT]++;
                         if (mcopy) {                  IP_STAT_PUTREF();
                   goto redirect;
           }
   
           IP_STAT_PUTREF();
           if (mcopy) {
 #ifdef GATEWAY  #ifdef GATEWAY
                                 if (mcopy->m_flags & M_CANFASTFWD)                  if (mcopy->m_flags & M_CANFASTFWD)
                                         ipflow_create(&ipforward_rt, mcopy);                          ipflow_create(ro, mcopy);
 #endif  #endif
                                 m_freem(mcopy);                  m_freem(mcopy);
                         }  
                         return;  
                 }  
         }          }
         if (mcopy == NULL)  
           percpu_putref(ipforward_rt_percpu);
           return;
   
   redirect:
   error:
           if (mcopy == NULL) {
                   percpu_putref(ipforward_rt_percpu);
                 return;                  return;
           }
   
         switch (error) {          switch (error) {
   
Line 1288  ip_forward(struct mbuf *m, int srcrt)
Line 1477  ip_forward(struct mbuf *m, int srcrt)
                 type = ICMP_UNREACH;                  type = ICMP_UNREACH;
                 code = ICMP_UNREACH_NEEDFRAG;                  code = ICMP_UNREACH_NEEDFRAG;
   
                 if ((rt = rtcache_validate(&ipforward_rt)) != NULL)                  if ((rt = rtcache_validate(ro)) != NULL) {
                         destmtu = rt->rt_ifp->if_mtu;                          destmtu = rt->rt_ifp->if_mtu;
                           rtcache_unref(rt, ro);
                   }
 #ifdef IPSEC  #ifdef IPSEC
                 (void)ipsec4_forward(mcopy, &destmtu);                  if (ipsec_used)
                           (void)ipsec4_forward(mcopy, &destmtu);
 #endif  #endif
                 IP_STATINC(IP_STAT_CANTFRAG);                  IP_STATINC(IP_STAT_CANTFRAG);
                 break;                  break;
Line 1305  ip_forward(struct mbuf *m, int srcrt)
Line 1497  ip_forward(struct mbuf *m, int srcrt)
                  */                   */
                 if (mcopy)                  if (mcopy)
                         m_freem(mcopy);                          m_freem(mcopy);
                   percpu_putref(ipforward_rt_percpu);
                 return;                  return;
         }          }
         icmp_error(mcopy, type, code, dest, destmtu);          icmp_error(mcopy, type, code, dest, destmtu);
           percpu_putref(ipforward_rt_percpu);
 }  }
   
 void  void
Line 1315  ip_savecontrol(struct inpcb *inp, struct
Line 1509  ip_savecontrol(struct inpcb *inp, struct
     struct mbuf *m)      struct mbuf *m)
 {  {
         struct socket *so = inp->inp_socket;          struct socket *so = inp->inp_socket;
         ifnet_t *ifp = m->m_pkthdr.rcvif;          ifnet_t *ifp;
         int inpflags = inp->inp_flags;          int inpflags = inp->inp_flags;
           struct psref psref;
   
           ifp = m_get_rcvif_psref(m, &psref);
           if (__predict_false(ifp == NULL))
                   return; /* XXX should report error? */
   
         if (so->so_options & SO_TIMESTAMP          if (so->so_options & SO_TIMESTAMP
 #ifdef SO_OTIMESTAMP  #ifdef SO_OTIMESTAMP
Line 1366  ip_savecontrol(struct inpcb *inp, struct
Line 1565  ip_savecontrol(struct inpcb *inp, struct
         if (inpflags & INP_RECVIF) {          if (inpflags & INP_RECVIF) {
                 struct sockaddr_dl sdl;                  struct sockaddr_dl sdl;
   
                 sockaddr_dl_init(&sdl, sizeof(sdl), ifp ?                  sockaddr_dl_init(&sdl, sizeof(sdl), ifp->if_index, 0, NULL, 0,
                     ifp->if_index : 0, 0, NULL, 0, NULL, 0);                      NULL, 0);
                 *mp = sbcreatecontrol(&sdl, sdl.sdl_len, IP_RECVIF, IPPROTO_IP);                  *mp = sbcreatecontrol(&sdl, sdl.sdl_len, IP_RECVIF, IPPROTO_IP);
                 if (*mp)                  if (*mp)
                         mp = &(*mp)->m_next;                          mp = &(*mp)->m_next;
Line 1378  ip_savecontrol(struct inpcb *inp, struct
Line 1577  ip_savecontrol(struct inpcb *inp, struct
                 if (*mp)                  if (*mp)
                         mp = &(*mp)->m_next;                          mp = &(*mp)->m_next;
         }          }
           m_put_rcvif_psref(ifp, &psref);
 }  }
   
 /*  /*
Line 1416  sysctl_net_inet_ip_pmtudto(SYSCTLFN_ARGS
Line 1616  sysctl_net_inet_ip_pmtudto(SYSCTLFN_ARGS
         int error, tmp;          int error, tmp;
         struct sysctlnode node;          struct sysctlnode node;
   
           icmp_mtudisc_lock();
   
         node = *rnode;          node = *rnode;
         tmp = ip_mtudisc_timeout;          tmp = ip_mtudisc_timeout;
         node.sysctl_data = &tmp;          node.sysctl_data = &tmp;
         error = sysctl_lookup(SYSCTLFN_CALL(&node));          error = sysctl_lookup(SYSCTLFN_CALL(&node));
         if (error || newp == NULL)          if (error || newp == NULL)
                 return (error);                  goto out;
         if (tmp < 0)          if (tmp < 0) {
                 return (EINVAL);                  error = EINVAL;
                   goto out;
         mutex_enter(softnet_lock);          }
   
         ip_mtudisc_timeout = tmp;          ip_mtudisc_timeout = tmp;
         rt_timer_queue_change(ip_mtudisc_timeout_q, ip_mtudisc_timeout);          rt_timer_queue_change(ip_mtudisc_timeout_q, ip_mtudisc_timeout);
           error = 0;
         mutex_exit(softnet_lock);  out:
           icmp_mtudisc_unlock();
         return (0);          return error;
 }  }
   
 static int  static int
Line 1539  sysctl_net_inet_ip_setup(struct sysctllo
Line 1741  sysctl_net_inet_ip_setup(struct sysctllo
                        sysctl_net_inet_ip_pmtudto, 0, (void *)&ip_mtudisc_timeout, 0,                         sysctl_net_inet_ip_pmtudto, 0, (void *)&ip_mtudisc_timeout, 0,
                        CTL_NET, PF_INET, IPPROTO_IP,                         CTL_NET, PF_INET, IPPROTO_IP,
                        IPCTL_MTUDISCTIMEOUT, CTL_EOL);                         IPCTL_MTUDISCTIMEOUT, CTL_EOL);
 #if NGIF > 0  
         sysctl_createv(clog, 0, NULL, NULL,  
                        CTLFLAG_PERMANENT|CTLFLAG_READWRITE,  
                        CTLTYPE_INT, "gifttl",  
                        SYSCTL_DESCR("Default TTL for a gif tunnel datagram"),  
                        NULL, 0, &ip_gif_ttl, 0,  
                        CTL_NET, PF_INET, IPPROTO_IP,  
                        IPCTL_GIF_TTL, CTL_EOL);  
 #endif /* NGIF */  
 #ifndef IPNOPRIVPORTS  #ifndef IPNOPRIVPORTS
         sysctl_createv(clog, 0, NULL, NULL,          sysctl_createv(clog, 0, NULL, NULL,
                        CTLFLAG_PERMANENT|CTLFLAG_READWRITE,                         CTLFLAG_PERMANENT|CTLFLAG_READWRITE,
Line 1604  sysctl_net_inet_ip_setup(struct sysctllo
Line 1797  sysctl_net_inet_ip_setup(struct sysctllo
                        sysctl_net_inet_ip_stats, 0, NULL, 0,                         sysctl_net_inet_ip_stats, 0, NULL, 0,
                        CTL_NET, PF_INET, IPPROTO_IP, IPCTL_STATS,                         CTL_NET, PF_INET, IPPROTO_IP, IPCTL_STATS,
                        CTL_EOL);                         CTL_EOL);
   #if NARP
           sysctl_createv(clog, 0, NULL, NULL,
                          CTLFLAG_PERMANENT|CTLFLAG_READWRITE,
                          CTLTYPE_INT, "dad_count",
                          SYSCTL_DESCR("Number of Duplicate Address Detection "
                                       "probes to send"),
                          NULL, 0, &ip_dad_count, 0,
                          CTL_NET, PF_INET, IPPROTO_IP,
                          IPCTL_DAD_COUNT, CTL_EOL);
   #endif
   
         /* anonportalgo RFC6056 subtree */          /* anonportalgo RFC6056 subtree */
         const struct sysctlnode *portalgo_node;          const struct sysctlnode *portalgo_node;

Legend:
Removed from v.1.314  
changed lines
  Added in v.1.355.2.3

CVSweb <webmaster@jp.NetBSD.org>