[BACK]Return to ip_input.c CVS log [TXT][DIR] Up to [cvs.NetBSD.org] / src / sys / netinet

Please note that diffs are not public domain; they are subject to the copyright notices on the relevant files.

Diff for /src/sys/netinet/ip_input.c between version 1.302.2.4 and 1.328

version 1.302.2.4, 2017/12/03 11:39:04 version 1.328, 2016/01/21 15:41:30
Line 95  __KERNEL_RCSID(0, "$NetBSD$");
Line 95  __KERNEL_RCSID(0, "$NetBSD$");
   
 #ifdef _KERNEL_OPT  #ifdef _KERNEL_OPT
 #include "opt_inet.h"  #include "opt_inet.h"
   #include "opt_compat_netbsd.h"
 #include "opt_gateway.h"  #include "opt_gateway.h"
 #include "opt_ipsec.h"  #include "opt_ipsec.h"
 #include "opt_mrouting.h"  #include "opt_mrouting.h"
 #include "opt_mbuftrace.h"  #include "opt_mbuftrace.h"
 #include "opt_inet_csum.h"  #include "opt_inet_csum.h"
 #include "opt_net_mpsafe.h"  
 #endif  #endif
   
 #include "arp.h"  #include "arp.h"
Line 173  __KERNEL_RCSID(0, "$NetBSD$");
Line 173  __KERNEL_RCSID(0, "$NetBSD$");
 #define IPMTUDISCTIMEOUT (10 * 60)      /* as per RFC 1191 */  #define IPMTUDISCTIMEOUT (10 * 60)      /* as per RFC 1191 */
 #endif  #endif
   
   #ifdef COMPAT_50
   #include <compat/sys/time.h>
   #include <compat/sys/socket.h>
   #endif
   
 /*  /*
  * Note: DIRECTED_BROADCAST is handled this way so that previous   * Note: DIRECTED_BROADCAST is handled this way so that previous
  * configuration using this option will Just Work.   * configuration using this option will Just Work.
Line 220  pfil_head_t *  inet_pfil_hook  __read_mo
Line 225  pfil_head_t *  inet_pfil_hook  __read_mo
 ipid_state_t *          ip_ids                  __read_mostly;  ipid_state_t *          ip_ids                  __read_mostly;
 percpu_t *              ipstat_percpu           __read_mostly;  percpu_t *              ipstat_percpu           __read_mostly;
   
 static percpu_t         *ipforward_rt_percpu    __cacheline_aligned;  static struct route     ipforward_rt            __cacheline_aligned;
   
 uint16_t ip_id;  uint16_t ip_id;
   
Line 247  EVCNT_ATTACH_STATIC(ip_swcsum);
Line 252  EVCNT_ATTACH_STATIC(ip_swcsum);
 #endif /* INET_CSUM_COUNTERS */  #endif /* INET_CSUM_COUNTERS */
   
 /*  /*
  * Used to save the IP options in case a protocol wants to respond   * We need to save the IP options in case a protocol wants to respond
  * to an incoming packet over the same route if the packet got here   * to an incoming packet over the same route if the packet got here
  * using IP source routing.  This allows connection establishment and   * using IP source routing.  This allows connection establishment and
  * maintenance when the remote end is on a network that is not known   * maintenance when the remote end is on a network that is not known
  * to us.   * to us.
  */   */
 struct ip_srcrt {  
         int             isr_nhops;                 /* number of hops */  static int      ip_nhops = 0;
         struct in_addr  isr_dst;                   /* final destination */  
         char            isr_nop;                   /* one NOP to align */  static  struct ip_srcrt {
         char            isr_hdr[IPOPT_OFFSET + 1]; /* OPTVAL, OLEN & OFFSET */          struct  in_addr dst;                    /* final destination */
         struct in_addr  isr_routes[MAX_IPOPTLEN/sizeof(struct in_addr)];          char    nop;                            /* one NOP to align */
 };          char    srcopt[IPOPT_OFFSET + 1];       /* OPTVAL, OLEN and OFFSET */
           struct  in_addr route[MAX_IPOPTLEN/sizeof(struct in_addr)];
   } ip_srcrt;
   
 static int ip_drainwanted;  static int ip_drainwanted;
   
 static void save_rte(struct mbuf *, u_char *, struct in_addr);  struct  sockaddr_in ipaddr = {
           .sin_len = sizeof(ipaddr),
           .sin_family = AF_INET,
   };
   
   static void save_rte(u_char *, struct in_addr);
   
 #ifdef MBUFTRACE  #ifdef MBUFTRACE
 struct mowner ip_rx_mowner = MOWNER_INIT("internet", "rx");  struct mowner ip_rx_mowner = MOWNER_INIT("internet", "rx");
Line 272  struct mowner ip_tx_mowner = MOWNER_INIT
Line 284  struct mowner ip_tx_mowner = MOWNER_INIT
   
 static void             ipintr(void *);  static void             ipintr(void *);
 static void             ip_input(struct mbuf *);  static void             ip_input(struct mbuf *);
 static void             ip_forward(struct mbuf *, int, struct ifnet *);  static void             ip_forward(struct mbuf *, int);
 static bool             ip_dooptions(struct mbuf *);  static bool             ip_dooptions(struct mbuf *);
 static struct in_ifaddr *ip_rtaddr(struct in_addr, struct psref *);  static struct in_ifaddr *ip_rtaddr(struct in_addr);
 static void             sysctl_net_inet_ip_setup(struct sysctllog **);  static void             sysctl_net_inet_ip_setup(struct sysctllog **);
   
 static struct in_ifaddr *ip_match_our_address(struct ifnet *, struct ip *,  /* XXX: Not yet enabled. */
                             int *);  
 static struct in_ifaddr *ip_match_our_address_broadcast(struct ifnet *,  
                             struct ip *);  
   
 #ifdef NET_MPSAFE  
 #define SOFTNET_LOCK()          mutex_enter(softnet_lock)  
 #define SOFTNET_UNLOCK()        mutex_exit(softnet_lock)  
 #else  
 #define SOFTNET_LOCK()          KASSERT(mutex_owned(softnet_lock))  #define SOFTNET_LOCK()          KASSERT(mutex_owned(softnet_lock))
 #define SOFTNET_UNLOCK()        KASSERT(mutex_owned(softnet_lock))  #define SOFTNET_UNLOCK()        KASSERT(mutex_owned(softnet_lock))
 #endif  
   
 /*  /*
  * IP initialization: fill in IP protocol switch table.   * IP initialization: fill in IP protocol switch table.
Line 322  ip_init(void)
Line 325  ip_init(void)
         ip_ids = ip_id_init();          ip_ids = ip_id_init();
         ip_id = time_uptime & 0xfffff;          ip_id = time_uptime & 0xfffff;
   
           ip_mtudisc_timeout_q = rt_timer_queue_create(ip_mtudisc_timeout);
 #ifdef GATEWAY  #ifdef GATEWAY
         ipflow_init();          ipflow_init();
 #endif  #endif
Line 336  ip_init(void)
Line 340  ip_init(void)
 #endif /* MBUFTRACE */  #endif /* MBUFTRACE */
   
         ipstat_percpu = percpu_alloc(sizeof(uint64_t) * IP_NSTATS);          ipstat_percpu = percpu_alloc(sizeof(uint64_t) * IP_NSTATS);
         ipforward_rt_percpu = percpu_alloc(sizeof(struct route));  
         ip_mtudisc_timeout_q = rt_timer_queue_create(ip_mtudisc_timeout);  
 }  
   
 static struct in_ifaddr *  
 ip_match_our_address(struct ifnet *ifp, struct ip *ip, int *downmatch)  
 {  
         struct in_ifaddr *ia = NULL;  
         int checkif;  
   
         /*  
          * Enable a consistency check between the destination address  
          * and the arrival interface for a unicast packet (the RFC 1122  
          * strong ES model) if IP forwarding is disabled and the packet  
          * is not locally generated.  
          *  
          * XXX - Checking also should be disabled if the destination  
          * address is ipnat'ed to a different interface.  
          *  
          * XXX - Checking is incompatible with IP aliases added  
          * to the loopback interface instead of the interface where  
          * the packets are received.  
          *  
          * XXX - We need to add a per ifaddr flag for this so that  
          * we get finer grain control.  
          */  
         checkif = ip_checkinterface && (ipforwarding == 0) &&  
             (ifp->if_flags & IFF_LOOPBACK) == 0;  
   
         IN_ADDRHASH_READER_FOREACH(ia, ip->ip_dst.s_addr) {  
                 if (in_hosteq(ia->ia_addr.sin_addr, ip->ip_dst)) {  
                         if (ia->ia4_flags & IN_IFF_NOTREADY)  
                                 continue;  
                         if (checkif && ia->ia_ifp != ifp)  
                                 continue;  
                         if ((ia->ia_ifp->if_flags & IFF_UP) == 0) {  
                                 (*downmatch)++;  
                                 continue;  
                         }  
                         if (ia->ia4_flags & IN_IFF_DETACHED &&  
                             (ifp->if_flags & IFF_LOOPBACK) == 0)  
                                 continue;  
                         break;  
                 }  
         }  
   
         return ia;  
 }  
   
 static struct in_ifaddr *  
 ip_match_our_address_broadcast(struct ifnet *ifp, struct ip *ip)  
 {  
         struct in_ifaddr *ia = NULL;  
         struct ifaddr *ifa;  
   
         IFADDR_READER_FOREACH(ifa, ifp) {  
                 if (ifa->ifa_addr->sa_family != AF_INET)  
                         continue;  
                 ia = ifatoia(ifa);  
                 if (ia->ia4_flags & IN_IFF_NOTREADY)  
                         continue;  
                 if (ia->ia4_flags & IN_IFF_DETACHED &&  
                     (ifp->if_flags & IFF_LOOPBACK) == 0)  
                         continue;  
                 if (in_hosteq(ip->ip_dst, ia->ia_broadaddr.sin_addr) ||  
                     in_hosteq(ip->ip_dst, ia->ia_netbroadcast) ||  
                     /*  
                      * Look for all-0's host part (old broadcast addr),  
                      * either for subnet or net.  
                      */  
                     ip->ip_dst.s_addr == ia->ia_subnet ||  
                     ip->ip_dst.s_addr == ia->ia_net)  
                         goto matched;  
                 /*  
                  * An interface with IP address zero accepts  
                  * all packets that arrive on that interface.  
                  */  
                 if (in_nullhost(ia->ia_addr.sin_addr))  
                         goto matched;  
         }  
         ia = NULL;  
   
 matched:  
         return ia;  
 }  }
   
 /*  /*
Line 432  ipintr(void *arg __unused)
Line 352  ipintr(void *arg __unused)
   
         KASSERT(cpu_softintr_p());          KASSERT(cpu_softintr_p());
   
         SOFTNET_LOCK_UNLESS_NET_MPSAFE();          mutex_enter(softnet_lock);
         while ((m = pktq_dequeue(ip_pktq)) != NULL) {          while ((m = pktq_dequeue(ip_pktq)) != NULL) {
                 ip_input(m);                  ip_input(m);
         }          }
         SOFTNET_UNLOCK_UNLESS_NET_MPSAFE();          mutex_exit(softnet_lock);
 }  }
   
 /*  /*
Line 447  static void
Line 367  static void
 ip_input(struct mbuf *m)  ip_input(struct mbuf *m)
 {  {
         struct ip *ip = NULL;          struct ip *ip = NULL;
         struct in_ifaddr *ia = NULL;          struct in_ifaddr *ia;
           struct ifaddr *ifa;
         int hlen = 0, len;          int hlen = 0, len;
         int downmatch;          int downmatch;
           int checkif;
         int srcrt = 0;          int srcrt = 0;
         ifnet_t *ifp;          ifnet_t *ifp;
         struct psref psref;  
         int s;  
   
         KASSERTMSG(cpu_softintr_p(), "ip_input: not in the software "          KASSERTMSG(cpu_softintr_p(), "ip_input: not in the software "
             "interrupt handler; synchronization assumptions violated");              "interrupt handler; synchronization assumptions violated");
   
         MCLAIM(m, &ip_rx_mowner);          MCLAIM(m, &ip_rx_mowner);
         KASSERT((m->m_flags & M_PKTHDR) != 0);          KASSERT((m->m_flags & M_PKTHDR) != 0);
           ifp = m->m_pkthdr.rcvif;
         ifp = m_get_rcvif_psref(m, &psref);  
         if (__predict_false(ifp == NULL))  
                 goto out;  
   
         /*          /*
          * If no IP addresses have been set yet but the interfaces           * If no IP addresses have been set yet but the interfaces
          * are receiving, can't do anything with incoming packets yet.           * are receiving, can't do anything with incoming packets yet.
          * Note: we pre-check without locks held.           * Note: we pre-check without locks held.
          */           */
         if (IN_ADDRLIST_READER_EMPTY())          if (!TAILQ_FIRST(&in_ifaddrhead)) {
                 goto out;                  goto bad;
           }
         IP_STATINC(IP_STAT_TOTAL);          IP_STATINC(IP_STAT_TOTAL);
   
         /*          /*
Line 485  ip_input(struct mbuf *m)
Line 403  ip_input(struct mbuf *m)
                                   (max_linkhdr + 3) & ~3)) == NULL) {                                    (max_linkhdr + 3) & ~3)) == NULL) {
                         /* XXXJRT new stat, please */                          /* XXXJRT new stat, please */
                         IP_STATINC(IP_STAT_TOOSMALL);                          IP_STATINC(IP_STAT_TOOSMALL);
                         goto out;                          return;
                 }                  }
         } else if (__predict_false(m->m_len < sizeof (struct ip))) {          } else if (__predict_false(m->m_len < sizeof (struct ip))) {
                 if ((m = m_pullup(m, sizeof (struct ip))) == NULL) {                  if ((m = m_pullup(m, sizeof (struct ip))) == NULL) {
                         IP_STATINC(IP_STAT_TOOSMALL);                          IP_STATINC(IP_STAT_TOOSMALL);
                         goto out;                          return;
                 }                  }
         }          }
         ip = mtod(m, struct ip *);          ip = mtod(m, struct ip *);
         if (ip->ip_v != IPVERSION) {          if (ip->ip_v != IPVERSION) {
                 IP_STATINC(IP_STAT_BADVERS);                  IP_STATINC(IP_STAT_BADVERS);
                 goto out;                  goto bad;
         }          }
         hlen = ip->ip_hl << 2;          hlen = ip->ip_hl << 2;
         if (hlen < sizeof(struct ip)) { /* minimum header length */          if (hlen < sizeof(struct ip)) { /* minimum header length */
                 IP_STATINC(IP_STAT_BADHLEN);                  IP_STATINC(IP_STAT_BADHLEN);
                 goto out;                  goto bad;
         }          }
         if (hlen > m->m_len) {          if (hlen > m->m_len) {
                 if ((m = m_pullup(m, hlen)) == NULL) {                  if ((m = m_pullup(m, hlen)) == NULL) {
                         IP_STATINC(IP_STAT_BADHLEN);                          IP_STATINC(IP_STAT_BADHLEN);
                         goto out;                          return;
                 }                  }
                 ip = mtod(m, struct ip *);                  ip = mtod(m, struct ip *);
         }          }
Line 517  ip_input(struct mbuf *m)
Line 435  ip_input(struct mbuf *m)
          */           */
         if (IN_MULTICAST(ip->ip_src.s_addr)) {          if (IN_MULTICAST(ip->ip_src.s_addr)) {
                 IP_STATINC(IP_STAT_BADADDR);                  IP_STATINC(IP_STAT_BADADDR);
                 goto out;                  goto bad;
         }          }
   
         /* 127/8 must not appear on wire - RFC1122 */          /* 127/8 must not appear on wire - RFC1122 */
Line 525  ip_input(struct mbuf *m)
Line 443  ip_input(struct mbuf *m)
             (ntohl(ip->ip_src.s_addr) >> IN_CLASSA_NSHIFT) == IN_LOOPBACKNET) {              (ntohl(ip->ip_src.s_addr) >> IN_CLASSA_NSHIFT) == IN_LOOPBACKNET) {
                 if ((ifp->if_flags & IFF_LOOPBACK) == 0) {                  if ((ifp->if_flags & IFF_LOOPBACK) == 0) {
                         IP_STATINC(IP_STAT_BADADDR);                          IP_STATINC(IP_STAT_BADADDR);
                         goto out;                          goto bad;
                 }                  }
         }          }
   
Line 534  ip_input(struct mbuf *m)
Line 452  ip_input(struct mbuf *m)
                  M_CSUM_IPv4_BAD)) {                   M_CSUM_IPv4_BAD)) {
         case M_CSUM_IPv4|M_CSUM_IPv4_BAD:          case M_CSUM_IPv4|M_CSUM_IPv4_BAD:
                 INET_CSUM_COUNTER_INCR(&ip_hwcsum_bad);                  INET_CSUM_COUNTER_INCR(&ip_hwcsum_bad);
                 IP_STATINC(IP_STAT_BADSUM);                  goto badcsum;
                 goto out;  
   
         case M_CSUM_IPv4:          case M_CSUM_IPv4:
                 /* Checksum was okay. */                  /* Checksum was okay. */
Line 550  ip_input(struct mbuf *m)
Line 467  ip_input(struct mbuf *m)
                 if (__predict_true(!(ifp->if_flags & IFF_LOOPBACK) ||                  if (__predict_true(!(ifp->if_flags & IFF_LOOPBACK) ||
                     ip_do_loopback_cksum)) {                      ip_do_loopback_cksum)) {
                         INET_CSUM_COUNTER_INCR(&ip_swcsum);                          INET_CSUM_COUNTER_INCR(&ip_swcsum);
                         if (in_cksum(m, hlen) != 0) {                          if (in_cksum(m, hlen) != 0)
                                 IP_STATINC(IP_STAT_BADSUM);                                  goto badcsum;
                                 goto out;  
                         }  
                 }                  }
                 break;                  break;
         }          }
Line 566  ip_input(struct mbuf *m)
Line 481  ip_input(struct mbuf *m)
          */           */
         if (len < hlen) {          if (len < hlen) {
                 IP_STATINC(IP_STAT_BADLEN);                  IP_STATINC(IP_STAT_BADLEN);
                 goto out;                  goto bad;
         }          }
   
         /*          /*
Line 577  ip_input(struct mbuf *m)
Line 492  ip_input(struct mbuf *m)
          */           */
         if (m->m_pkthdr.len < len) {          if (m->m_pkthdr.len < len) {
                 IP_STATINC(IP_STAT_TOOSHORT);                  IP_STATINC(IP_STAT_TOOSHORT);
                 goto out;                  goto bad;
         }          }
         if (m->m_pkthdr.len > len) {          if (m->m_pkthdr.len > len) {
                 if (m->m_len == m->m_pkthdr.len) {                  if (m->m_len == m->m_pkthdr.len) {
Line 609  ip_input(struct mbuf *m)
Line 524  ip_input(struct mbuf *m)
                 struct in_addr odst = ip->ip_dst;                  struct in_addr odst = ip->ip_dst;
                 bool freed;                  bool freed;
   
                   SOFTNET_LOCK();
                 freed = pfil_run_hooks(inet_pfil_hook, &m, ifp, PFIL_IN) != 0;                  freed = pfil_run_hooks(inet_pfil_hook, &m, ifp, PFIL_IN) != 0;
                   SOFTNET_UNLOCK();
                 if (freed || m == NULL) {                  if (freed || m == NULL) {
                         m = NULL;                          return;
                         goto out;  
                 }                  }
                 ip = mtod(m, struct ip *);                  ip = mtod(m, struct ip *);
                 hlen = ip->ip_hl << 2;                  hlen = ip->ip_hl << 2;
Line 641  ip_input(struct mbuf *m)
Line 557  ip_input(struct mbuf *m)
                 if ((*altq_input)(m, AF_INET) == 0) {                  if ((*altq_input)(m, AF_INET) == 0) {
                         /* Packet dropped by traffic conditioner. */                          /* Packet dropped by traffic conditioner. */
                         SOFTNET_UNLOCK();                          SOFTNET_UNLOCK();
                         m = NULL;                          return;
                         goto out;  
                 }                  }
                 SOFTNET_UNLOCK();                  SOFTNET_UNLOCK();
         }          }
Line 654  ip_input(struct mbuf *m)
Line 569  ip_input(struct mbuf *m)
          * error was detected (causing an icmp message           * error was detected (causing an icmp message
          * to be sent and the original packet to be freed).           * to be sent and the original packet to be freed).
          */           */
         if (hlen > sizeof (struct ip) && ip_dooptions(m)) {          ip_nhops = 0;           /* for source routed packets */
                 m = NULL;          if (hlen > sizeof (struct ip) && ip_dooptions(m))
                 goto out;                  return;
         }  
           /*
            * Enable a consistency check between the destination address
            * and the arrival interface for a unicast packet (the RFC 1122
            * strong ES model) if IP forwarding is disabled and the packet
            * is not locally generated.
            *
            * XXX - Checking also should be disabled if the destination
            * address is ipnat'ed to a different interface.
            *
            * XXX - Checking is incompatible with IP aliases added
            * to the loopback interface instead of the interface where
            * the packets are received.
            *
            * XXX - We need to add a per ifaddr flag for this so that
            * we get finer grain control.
            */
           checkif = ip_checkinterface && (ipforwarding == 0) &&
               (ifp->if_flags & IFF_LOOPBACK) == 0;
   
         /*          /*
          * Check our list of addresses, to see if the packet is for us.           * Check our list of addresses, to see if the packet is for us.
Line 667  ip_input(struct mbuf *m)
Line 600  ip_input(struct mbuf *m)
          * or IN_IFF_NOTREADY addresses as not mine.           * or IN_IFF_NOTREADY addresses as not mine.
          */           */
         downmatch = 0;          downmatch = 0;
         s = pserialize_read_enter();          LIST_FOREACH(ia, &IN_IFADDR_HASH(ip->ip_dst.s_addr), ia_hash) {
         ia = ip_match_our_address(ifp, ip, &downmatch);                  if (in_hosteq(ia->ia_addr.sin_addr, ip->ip_dst)) {
         if (ia != NULL) {                          if (ia->ia4_flags & IN_IFF_NOTREADY)
                 pserialize_read_exit(s);                                  continue;
                 goto ours;                          if (checkif && ia->ia_ifp != ifp)
                                   continue;
                           if ((ia->ia_ifp->if_flags & IFF_UP) != 0)
                                   break;
                           else
                                   downmatch++;
                   }
         }          }
           if (ia != NULL)
                   goto ours;
         if (ifp->if_flags & IFF_BROADCAST) {          if (ifp->if_flags & IFF_BROADCAST) {
                 ia = ip_match_our_address_broadcast(ifp, ip);                  IFADDR_FOREACH(ifa, ifp) {
                 if (ia != NULL) {                          if (ifa->ifa_addr->sa_family != AF_INET)
                         pserialize_read_exit(s);                                  continue;
                         goto ours;                          ia = ifatoia(ifa);
                           if (ia->ia4_flags & IN_IFF_NOTREADY)
                                   continue;
                           if (in_hosteq(ip->ip_dst, ia->ia_broadaddr.sin_addr) ||
                               in_hosteq(ip->ip_dst, ia->ia_netbroadcast) ||
                               /*
                                * Look for all-0's host part (old broadcast addr),
                                * either for subnet or net.
                                */
                               ip->ip_dst.s_addr == ia->ia_subnet ||
                               ip->ip_dst.s_addr == ia->ia_net)
                                   goto ours;
                           /*
                            * An interface with IP address zero accepts
                            * all packets that arrive on that interface.
                            */
                           if (in_nullhost(ia->ia_addr.sin_addr))
                                   goto ours;
                 }                  }
         }          }
         pserialize_read_exit(s);  
   
         if (IN_MULTICAST(ip->ip_dst.s_addr)) {          if (IN_MULTICAST(ip->ip_dst.s_addr)) {
 #ifdef MROUTING  #ifdef MROUTING
                 extern struct socket *ip_mrouter;                  extern struct socket *ip_mrouter;
Line 704  ip_input(struct mbuf *m)
Line 659  ip_input(struct mbuf *m)
                         if (ip_mforward(m, ifp) != 0) {                          if (ip_mforward(m, ifp) != 0) {
                                 SOFTNET_UNLOCK();                                  SOFTNET_UNLOCK();
                                 IP_STATINC(IP_STAT_CANTFORWARD);                                  IP_STATINC(IP_STAT_CANTFORWARD);
                                 goto out;                                  m_freem(m);
                                   return;
                         }                          }
                         SOFTNET_UNLOCK();                          SOFTNET_UNLOCK();
   
Line 725  ip_input(struct mbuf *m)
Line 681  ip_input(struct mbuf *m)
                  */                   */
                 if (!in_multi_group(ip->ip_dst, ifp, 0)) {                  if (!in_multi_group(ip->ip_dst, ifp, 0)) {
                         IP_STATINC(IP_STAT_CANTFORWARD);                          IP_STATINC(IP_STAT_CANTFORWARD);
                         goto out;                          m_freem(m);
                           return;
                 }                  }
                 goto ours;                  goto ours;
         }          }
Line 737  ip_input(struct mbuf *m)
Line 694  ip_input(struct mbuf *m)
          * Not for us; forward if possible and desirable.           * Not for us; forward if possible and desirable.
          */           */
         if (ipforwarding == 0) {          if (ipforwarding == 0) {
                 m_put_rcvif_psref(ifp, &psref);  
                 IP_STATINC(IP_STAT_CANTFORWARD);                  IP_STATINC(IP_STAT_CANTFORWARD);
                 m_freem(m);                  m_freem(m);
         } else {          } else {
Line 748  ip_input(struct mbuf *m)
Line 704  ip_input(struct mbuf *m)
                  * forwarding loop till TTL goes to 0.                   * forwarding loop till TTL goes to 0.
                  */                   */
                 if (downmatch) {                  if (downmatch) {
                         m_put_rcvif_psref(ifp, &psref);  
                         icmp_error(m, ICMP_UNREACH, ICMP_UNREACH_HOST, 0, 0);                          icmp_error(m, ICMP_UNREACH, ICMP_UNREACH_HOST, 0, 0);
                         IP_STATINC(IP_STAT_CANTFORWARD);                          IP_STATINC(IP_STAT_CANTFORWARD);
                         return;                          return;
                 }                  }
 #ifdef IPSEC  #ifdef IPSEC
                 /* Check the security policy (SP) for the packet */                  /* Perform IPsec, if any. */
                 if (ipsec_used) {                  if (ipsec_used) {
                           SOFTNET_LOCK();
                         if (ipsec4_input(m, IP_FORWARDING |                          if (ipsec4_input(m, IP_FORWARDING |
                             (ip_directedbcast ? IP_ALLOWBROADCAST : 0)) != 0) {                              (ip_directedbcast ? IP_ALLOWBROADCAST : 0)) != 0) {
                                 goto out;                                  SOFTNET_UNLOCK();
                                   goto bad;
                         }                          }
                           SOFTNET_UNLOCK();
                 }                  }
 #endif  #endif
                 ip_forward(m, srcrt, ifp);                  ip_forward(m, srcrt);
                 m_put_rcvif_psref(ifp, &psref);  
         }          }
         return;          return;
   
 ours:  ours:
         m_put_rcvif_psref(ifp, &psref);  
         ifp = NULL;  
   
         /*          /*
          * If offset or IP_MF are set, must reassemble.           * If offset or IP_MF are set, must reassemble.
          */           */
Line 780  ours:
Line 734  ours:
                  */                   */
                 if (ip_reass_packet(&m, ip) != 0) {                  if (ip_reass_packet(&m, ip) != 0) {
                         /* Failed; invalid fragment(s) or packet. */                          /* Failed; invalid fragment(s) or packet. */
                         goto out;                          goto bad;
                 }                  }
                 if (m == NULL) {                  if (m == NULL) {
                         /* More fragments should come; silently return. */                          /* More fragments should come; silently return. */
                         goto out;                          return;
                 }                  }
                 /*                  /*
                  * Reassembly is done, we have the final packet.                   * Reassembly is done, we have the final packet.
Line 802  ours:
Line 756  ours:
          */           */
         if (ipsec_used &&          if (ipsec_used &&
             (inetsw[ip_protox[ip->ip_p]].pr_flags & PR_LASTHDR) != 0) {              (inetsw[ip_protox[ip->ip_p]].pr_flags & PR_LASTHDR) != 0) {
                   SOFTNET_LOCK();
                 if (ipsec4_input(m, 0) != 0) {                  if (ipsec4_input(m, 0) != 0) {
                         goto out;                          SOFTNET_UNLOCK();
                           goto bad;
                 }                  }
                   SOFTNET_UNLOCK();
         }          }
 #endif  #endif
   
Line 812  ours:
Line 769  ours:
          * Switch out to protocol's input routine.           * Switch out to protocol's input routine.
          */           */
 #if IFA_STATS  #if IFA_STATS
         if (ia && ip) {          if (ia && ip)
                 struct in_ifaddr *_ia;                  ia->ia_ifa.ifa_data.ifad_inbytes += ntohs(ip->ip_len);
                 /*  
                  * Keep a reference from ip_match_our_address with psref  
                  * is expensive, so explore ia here again.  
                  */  
                 s = pserialize_read_enter();  
                 _ia = in_get_ia(ip->ip_dst);  
                 _ia->ia_ifa.ifa_data.ifad_inbytes += ntohs(ip->ip_len);  
                 pserialize_read_exit(s);  
         }  
 #endif  #endif
         IP_STATINC(IP_STAT_DELIVERED);          IP_STATINC(IP_STAT_DELIVERED);
   
         const int off = hlen, nh = ip->ip_p;          const int off = hlen, nh = ip->ip_p;
   
           SOFTNET_LOCK();
         (*inetsw[ip_protox[nh]].pr_input)(m, off, nh);          (*inetsw[ip_protox[nh]].pr_input)(m, off, nh);
           SOFTNET_UNLOCK();
           return;
   bad:
           m_freem(m);
         return;          return;
   
 out:  badcsum:
         m_put_rcvif_psref(ifp, &psref);          IP_STATINC(IP_STAT_BADSUM);
         if (m != NULL)          m_freem(m);
                 m_freem(m);  
 }  }
   
 /*  /*
Line 844  void
Line 796  void
 ip_slowtimo(void)  ip_slowtimo(void)
 {  {
   
         SOFTNET_KERNEL_LOCK_UNLESS_NET_MPSAFE();          mutex_enter(softnet_lock);
           KERNEL_LOCK(1, NULL);
   
         ip_reass_slowtimo();          ip_reass_slowtimo();
   
         SOFTNET_KERNEL_UNLOCK_UNLESS_NET_MPSAFE();          KERNEL_UNLOCK_ONE(NULL);
           mutex_exit(softnet_lock);
 }  }
   
 /*  /*
Line 880  ip_dooptions(struct mbuf *m)
Line 834  ip_dooptions(struct mbuf *m)
         int opt, optlen, cnt, off, code, type = ICMP_PARAMPROB, forward = 0;          int opt, optlen, cnt, off, code, type = ICMP_PARAMPROB, forward = 0;
         struct in_addr dst;          struct in_addr dst;
         n_time ntime;          n_time ntime;
         struct ifaddr *ifa = NULL;  
         int s;  
   
         dst = ip->ip_dst;          dst = ip->ip_dst;
         cp = (u_char *)(ip + 1);          cp = (u_char *)(ip + 1);
Line 918  ip_dooptions(struct mbuf *m)
Line 870  ip_dooptions(struct mbuf *m)
                  * address is on directly accessible net.                   * address is on directly accessible net.
                  */                   */
                 case IPOPT_LSRR:                  case IPOPT_LSRR:
                 case IPOPT_SSRR: {                  case IPOPT_SSRR:
                         struct psref psref;  
                         struct sockaddr_in ipaddr = {  
                             .sin_len = sizeof(ipaddr),  
                             .sin_family = AF_INET,  
                         };  
   
                         if (ip_allowsrcrt == 0) {                          if (ip_allowsrcrt == 0) {
                                 type = ICMP_UNREACH;                                  type = ICMP_UNREACH;
                                 code = ICMP_UNREACH_NET_PROHIB;                                  code = ICMP_UNREACH_NET_PROHIB;
Line 939  ip_dooptions(struct mbuf *m)
Line 885  ip_dooptions(struct mbuf *m)
                                 goto bad;                                  goto bad;
                         }                          }
                         ipaddr.sin_addr = ip->ip_dst;                          ipaddr.sin_addr = ip->ip_dst;
                           ia = ifatoia(ifa_ifwithaddr(sintosa(&ipaddr)));
                         s = pserialize_read_enter();                          if (ia == 0) {
                         ifa = ifa_ifwithaddr(sintosa(&ipaddr));  
                         if (ifa == NULL) {  
                                 pserialize_read_exit(s);  
                                 if (opt == IPOPT_SSRR) {                                  if (opt == IPOPT_SSRR) {
                                         type = ICMP_UNREACH;                                          type = ICMP_UNREACH;
                                         code = ICMP_UNREACH_SRCFAIL;                                          code = ICMP_UNREACH_SRCFAIL;
Line 955  ip_dooptions(struct mbuf *m)
Line 898  ip_dooptions(struct mbuf *m)
                                  */                                   */
                                 break;                                  break;
                         }                          }
                         pserialize_read_exit(s);  
   
                         off--;                  /* 0 origin */                          off--;                  /* 0 origin */
                         if ((off + sizeof(struct in_addr)) > optlen) {                          if ((off + sizeof(struct in_addr)) > optlen) {
                                 /*                                  /*
                                  * End of source route.  Should be for us.                                   * End of source route.  Should be for us.
                                  */                                   */
                                 save_rte(m, cp, ip->ip_src);                                  save_rte(cp, ip->ip_src);
                                 break;                                  break;
                         }                          }
                         /*                          /*
Line 970  ip_dooptions(struct mbuf *m)
Line 911  ip_dooptions(struct mbuf *m)
                          */                           */
                         memcpy((void *)&ipaddr.sin_addr, (void *)(cp + off),                          memcpy((void *)&ipaddr.sin_addr, (void *)(cp + off),
                             sizeof(ipaddr.sin_addr));                              sizeof(ipaddr.sin_addr));
                         if (opt == IPOPT_SSRR) {                          if (opt == IPOPT_SSRR)
                                 ifa = ifa_ifwithladdr_psref(sintosa(&ipaddr),                                  ia = ifatoia(ifa_ifwithladdr(sintosa(&ipaddr)));
                                     &psref);                          else
                                 if (ifa != NULL)                                  ia = ip_rtaddr(ipaddr.sin_addr);
                                         ia = ifatoia(ifa);                          if (ia == 0) {
                                 else  
                                         ia = NULL;  
                         } else {  
                                 ia = ip_rtaddr(ipaddr.sin_addr, &psref);  
                         }  
                         if (ia == NULL) {  
                                 type = ICMP_UNREACH;                                  type = ICMP_UNREACH;
                                 code = ICMP_UNREACH_SRCFAIL;                                  code = ICMP_UNREACH_SRCFAIL;
                                 goto bad;                                  goto bad;
Line 988  ip_dooptions(struct mbuf *m)
Line 923  ip_dooptions(struct mbuf *m)
                         ip->ip_dst = ipaddr.sin_addr;                          ip->ip_dst = ipaddr.sin_addr;
                         bcopy((void *)&ia->ia_addr.sin_addr,                          bcopy((void *)&ia->ia_addr.sin_addr,
                             (void *)(cp + off), sizeof(struct in_addr));                              (void *)(cp + off), sizeof(struct in_addr));
                         ia4_release(ia, &psref);  
                         cp[IPOPT_OFFSET] += sizeof(struct in_addr);                          cp[IPOPT_OFFSET] += sizeof(struct in_addr);
                         /*                          /*
                          * Let ip_intr's mcast routing check handle mcast pkts                           * Let ip_intr's mcast routing check handle mcast pkts
                          */                           */
                         forward = !IN_MULTICAST(ip->ip_dst.s_addr);                          forward = !IN_MULTICAST(ip->ip_dst.s_addr);
                         break;                          break;
                     }  
   
                 case IPOPT_RR: {  
                         struct psref psref;  
                         struct sockaddr_in ipaddr = {  
                             .sin_len = sizeof(ipaddr),  
                             .sin_family = AF_INET,  
                         };  
   
                   case IPOPT_RR:
                         if (optlen < IPOPT_OFFSET + sizeof(*cp)) {                          if (optlen < IPOPT_OFFSET + sizeof(*cp)) {
                                 code = &cp[IPOPT_OLEN] - (u_char *)ip;                                  code = &cp[IPOPT_OLEN] - (u_char *)ip;
                                 goto bad;                                  goto bad;
Line 1024  ip_dooptions(struct mbuf *m)
Line 951  ip_dooptions(struct mbuf *m)
                          * locate outgoing interface; if we're the destination,                           * locate outgoing interface; if we're the destination,
                          * use the incoming interface (should be same).                           * use the incoming interface (should be same).
                          */                           */
                         ifa = ifa_ifwithaddr_psref(sintosa(&ipaddr), &psref);                          if ((ia = ifatoia(ifa_ifwithaddr(sintosa(&ipaddr))))
                         if (ifa == NULL) {                              == NULL &&
                                 ia = ip_rtaddr(ipaddr.sin_addr, &psref);                              (ia = ip_rtaddr(ipaddr.sin_addr)) == NULL) {
                                 if (ia == NULL) {                                  type = ICMP_UNREACH;
                                         type = ICMP_UNREACH;                                  code = ICMP_UNREACH_HOST;
                                         code = ICMP_UNREACH_HOST;                                  goto bad;
                                         goto bad;  
                                 }  
                         } else {  
                                 ia = ifatoia(ifa);  
                         }                          }
                         bcopy((void *)&ia->ia_addr.sin_addr,                          bcopy((void *)&ia->ia_addr.sin_addr,
                             (void *)(cp + off), sizeof(struct in_addr));                              (void *)(cp + off), sizeof(struct in_addr));
                         ia4_release(ia, &psref);  
                         cp[IPOPT_OFFSET] += sizeof(struct in_addr);                          cp[IPOPT_OFFSET] += sizeof(struct in_addr);
                         break;                          break;
                     }  
   
                 case IPOPT_TS:                  case IPOPT_TS:
                         code = cp - (u_char *)ip;                          code = cp - (u_char *)ip;
Line 1067  ip_dooptions(struct mbuf *m)
Line 988  ip_dooptions(struct mbuf *m)
                         case IPOPT_TS_TSONLY:                          case IPOPT_TS_TSONLY:
                                 break;                                  break;
   
                         case IPOPT_TS_TSANDADDR: {                          case IPOPT_TS_TSANDADDR:
                                 struct ifnet *rcvif;  
                                 int _s, _ss;  
                                 struct sockaddr_in ipaddr = {  
                                     .sin_len = sizeof(ipaddr),  
                                     .sin_family = AF_INET,  
                                 };  
   
                                 if (ipt->ipt_ptr - 1 + sizeof(n_time) +                                  if (ipt->ipt_ptr - 1 + sizeof(n_time) +
                                     sizeof(struct in_addr) > ipt->ipt_len) {                                      sizeof(struct in_addr) > ipt->ipt_len) {
                                         code = (u_char *)&ipt->ipt_ptr -                                          code = (u_char *)&ipt->ipt_ptr -
Line 1082  ip_dooptions(struct mbuf *m)
Line 996  ip_dooptions(struct mbuf *m)
                                         goto bad;                                          goto bad;
                                 }                                  }
                                 ipaddr.sin_addr = dst;                                  ipaddr.sin_addr = dst;
                                 _ss = pserialize_read_enter();                                  ia = ifatoia(ifaof_ifpforaddr(sintosa(&ipaddr),
                                 rcvif = m_get_rcvif(m, &_s);                                      m->m_pkthdr.rcvif));
                                 if (__predict_true(rcvif != NULL)) {                                  if (ia == 0)
                                         ifa = ifaof_ifpforaddr(sintosa(&ipaddr),                                          continue;
                                             rcvif);  
                                 }  
                                 m_put_rcvif(rcvif, &_s);  
                                 if (ifa == NULL) {  
                                         pserialize_read_exit(_ss);  
                                         break;  
                                 }  
                                 ia = ifatoia(ifa);  
                                 bcopy(&ia->ia_addr.sin_addr,                                  bcopy(&ia->ia_addr.sin_addr,
                                     cp0, sizeof(struct in_addr));                                      cp0, sizeof(struct in_addr));
                                 pserialize_read_exit(_ss);  
                                 ipt->ipt_ptr += sizeof(struct in_addr);                                  ipt->ipt_ptr += sizeof(struct in_addr);
                                 break;                                  break;
                         }  
   
                         case IPOPT_TS_PRESPEC: {  
                                 struct sockaddr_in ipaddr = {  
                                     .sin_len = sizeof(ipaddr),  
                                     .sin_family = AF_INET,  
                                 };  
   
                           case IPOPT_TS_PRESPEC:
                                 if (ipt->ipt_ptr - 1 + sizeof(n_time) +                                  if (ipt->ipt_ptr - 1 + sizeof(n_time) +
                                     sizeof(struct in_addr) > ipt->ipt_len) {                                      sizeof(struct in_addr) > ipt->ipt_len) {
                                         code = (u_char *)&ipt->ipt_ptr -                                          code = (u_char *)&ipt->ipt_ptr -
Line 1115  ip_dooptions(struct mbuf *m)
Line 1014  ip_dooptions(struct mbuf *m)
                                 }                                  }
                                 memcpy(&ipaddr.sin_addr, cp0,                                  memcpy(&ipaddr.sin_addr, cp0,
                                     sizeof(struct in_addr));                                      sizeof(struct in_addr));
                                 s = pserialize_read_enter();                                  if (ifatoia(ifa_ifwithaddr(sintosa(&ipaddr)))
                                 ifa = ifa_ifwithaddr(sintosa(&ipaddr));                                      == NULL)
                                 if (ifa == NULL) {  
                                         pserialize_read_exit(s);  
                                         continue;                                          continue;
                                 }  
                                 pserialize_read_exit(s);  
                                 ipt->ipt_ptr += sizeof(struct in_addr);                                  ipt->ipt_ptr += sizeof(struct in_addr);
                                 break;                                  break;
                             }  
   
                         default:                          default:
                                 /* XXX can't take &ipt->ipt_flg */                                  /* XXX can't take &ipt->ipt_flg */
Line 1140  ip_dooptions(struct mbuf *m)
Line 1034  ip_dooptions(struct mbuf *m)
                 }                  }
         }          }
         if (forward) {          if (forward) {
                 struct ifnet *rcvif;  
                 struct psref _psref;  
   
                 if (ip_forwsrcrt == 0) {                  if (ip_forwsrcrt == 0) {
                         type = ICMP_UNREACH;                          type = ICMP_UNREACH;
                         code = ICMP_UNREACH_SRCFAIL;                          code = ICMP_UNREACH_SRCFAIL;
                         goto bad;                          goto bad;
                 }                  }
                   ip_forward(m, 1);
                 rcvif = m_get_rcvif_psref(m, &_psref);  
                 if (__predict_false(rcvif == NULL)) {  
                         type = ICMP_UNREACH;  
                         code = ICMP_UNREACH_HOST;  
                         goto bad;  
                 }  
                 ip_forward(m, 1, rcvif);  
                 m_put_rcvif_psref(rcvif, &_psref);  
                 return true;                  return true;
         }          }
         return false;          return false;
Line 1171  bad:
Line 1054  bad:
  * return internet address info of interface to be used to get there.   * return internet address info of interface to be used to get there.
  */   */
 static struct in_ifaddr *  static struct in_ifaddr *
 ip_rtaddr(struct in_addr dst, struct psref *psref)  ip_rtaddr(struct in_addr dst)
 {  {
         struct rtentry *rt;          struct rtentry *rt;
         union {          union {
                 struct sockaddr         dst;                  struct sockaddr         dst;
                 struct sockaddr_in      dst4;                  struct sockaddr_in      dst4;
         } u;          } u;
         struct route *ro;  
   
         sockaddr_in_init(&u.dst4, &dst, 0);          sockaddr_in_init(&u.dst4, &dst, 0);
   
         ro = percpu_getref(ipforward_rt_percpu);          SOFTNET_LOCK();
         rt = rtcache_lookup(ro, &u.dst);          rt = rtcache_lookup(&ipforward_rt, &u.dst);
         if (rt == NULL) {          SOFTNET_UNLOCK();
                 percpu_putref(ipforward_rt_percpu);          if (rt == NULL)
                 return NULL;                  return NULL;
         }  
   
         ia4_acquire(ifatoia(rt->rt_ifa), psref);  
         rtcache_unref(rt, ro);  
         percpu_putref(ipforward_rt_percpu);  
   
         return ifatoia(rt->rt_ifa);          return ifatoia(rt->rt_ifa);
 }  }
Line 1201  ip_rtaddr(struct in_addr dst, struct psr
Line 1078  ip_rtaddr(struct in_addr dst, struct psr
  * up later by ip_srcroute if the receiver is interested.   * up later by ip_srcroute if the receiver is interested.
  */   */
 static void  static void
 save_rte(struct mbuf *m, u_char *option, struct in_addr dst)  save_rte(u_char *option, struct in_addr dst)
 {  {
         struct ip_srcrt *isr;  
         struct m_tag *mtag;  
         unsigned olen;          unsigned olen;
   
         olen = option[IPOPT_OLEN];          olen = option[IPOPT_OLEN];
         if (olen > sizeof(isr->isr_hdr) + sizeof(isr->isr_routes))          if (olen > sizeof(ip_srcrt) - (1 + sizeof(dst)))
                 return;                  return;
           memcpy((void *)ip_srcrt.srcopt, (void *)option, olen);
         mtag = m_tag_get(PACKET_TAG_SRCROUTE, sizeof(*isr), M_NOWAIT);          ip_nhops = (olen - IPOPT_OFFSET - 1) / sizeof(struct in_addr);
         if (mtag == NULL)          ip_srcrt.dst = dst;
                 return;  
         isr = (struct ip_srcrt *)(mtag + 1);  
   
         memcpy(isr->isr_hdr, option, olen);  
         isr->isr_nhops = (olen - IPOPT_OFFSET - 1) / sizeof(struct in_addr);  
         isr->isr_dst = dst;  
         m_tag_prepend(m, mtag);  
 }  }
   
 /*  /*
Line 1228  save_rte(struct mbuf *m, u_char *option,
Line 1096  save_rte(struct mbuf *m, u_char *option,
  * The first hop is placed before the options, will be removed later.   * The first hop is placed before the options, will be removed later.
  */   */
 struct mbuf *  struct mbuf *
 ip_srcroute(struct mbuf *m0)  ip_srcroute(void)
 {  {
         struct in_addr *p, *q;          struct in_addr *p, *q;
         struct mbuf *m;          struct mbuf *m;
         struct ip_srcrt *isr;  
         struct m_tag *mtag;  
   
         mtag = m_tag_find(m0, PACKET_TAG_SRCROUTE, NULL);          if (ip_nhops == 0)
         if (mtag == NULL)  
                 return NULL;                  return NULL;
         isr = (struct ip_srcrt *)(mtag + 1);  
   
         if (isr->isr_nhops == 0)  
                 return NULL;  
   
         m = m_get(M_DONTWAIT, MT_SOOPTS);          m = m_get(M_DONTWAIT, MT_SOOPTS);
         if (m == NULL)          if (m == 0)
                 return NULL;                  return NULL;
   
         MCLAIM(m, &inetdomain.dom_mowner);          MCLAIM(m, &inetdomain.dom_mowner);
 #define OPTSIZ  (sizeof(isr->isr_nop) + sizeof(isr->isr_hdr))  #define OPTSIZ  (sizeof(ip_srcrt.nop) + sizeof(ip_srcrt.srcopt))
   
         /* length is (nhops+1)*sizeof(addr) + sizeof(nop + header) */          /* length is (nhops+1)*sizeof(addr) + sizeof(nop + srcrt header) */
         m->m_len = (isr->isr_nhops + 1) * sizeof(struct in_addr) + OPTSIZ;          m->m_len = ip_nhops * sizeof(struct in_addr) + sizeof(struct in_addr) +
               OPTSIZ;
   
         /*          /*
          * First save first hop for return route           * First save first hop for return route
          */           */
         p = &(isr->isr_routes[isr->isr_nhops - 1]);          p = &ip_srcrt.route[ip_nhops - 1];
         *(mtod(m, struct in_addr *)) = *p--;          *(mtod(m, struct in_addr *)) = *p--;
   
         /*          /*
          * Copy option fields and padding (nop) to mbuf.           * Copy option fields and padding (nop) to mbuf.
          */           */
         isr->isr_nop = IPOPT_NOP;          ip_srcrt.nop = IPOPT_NOP;
         isr->isr_hdr[IPOPT_OFFSET] = IPOPT_MINOFF;          ip_srcrt.srcopt[IPOPT_OFFSET] = IPOPT_MINOFF;
         memmove(mtod(m, char *) + sizeof(struct in_addr), &isr->isr_nop,          memmove(mtod(m, char *) + sizeof(struct in_addr), &ip_srcrt.nop,
             OPTSIZ);              OPTSIZ);
         q = (struct in_addr *)(mtod(m, char *) +          q = (struct in_addr *)(mtod(m, char *) +
             sizeof(struct in_addr) + OPTSIZ);              sizeof(struct in_addr) + OPTSIZ);
Line 1273  ip_srcroute(struct mbuf *m0)
Line 1134  ip_srcroute(struct mbuf *m0)
          * Record return path as an IP source route,           * Record return path as an IP source route,
          * reversing the path (pointers are now aligned).           * reversing the path (pointers are now aligned).
          */           */
         while (p >= isr->isr_routes) {          while (p >= ip_srcrt.route) {
                 *q++ = *p--;                  *q++ = *p--;
         }          }
         /*          /*
          * Last hop goes to final destination.           * Last hop goes to final destination.
          */           */
         *q = isr->isr_dst;          *q = ip_srcrt.dst;
         m_tag_delete(m0, mtag);          return (m);
         return m;  
 }  }
   
 const int inetctlerrmap[PRC_NCMDS] = {  const int inetctlerrmap[PRC_NCMDS] = {
Line 1326  ip_drainstub(void)
Line 1186  ip_drainstub(void)
  * via a source route.   * via a source route.
  */   */
 static void  static void
 ip_forward(struct mbuf *m, int srcrt, struct ifnet *rcvif)  ip_forward(struct mbuf *m, int srcrt)
 {  {
         struct ip *ip = mtod(m, struct ip *);          struct ip *ip = mtod(m, struct ip *);
         struct rtentry *rt;          struct rtentry *rt;
Line 1338  ip_forward(struct mbuf *m, int srcrt, st
Line 1198  ip_forward(struct mbuf *m, int srcrt, st
                 struct sockaddr_in      dst4;                  struct sockaddr_in      dst4;
         } u;          } u;
         uint64_t *ips;          uint64_t *ips;
         struct route *ro;  
   
         KASSERTMSG(cpu_softintr_p(), "ip_forward: not in the software "          KASSERTMSG(cpu_softintr_p(), "ip_forward: not in the software "
             "interrupt handler; synchronization assumptions violated");              "interrupt handler; synchronization assumptions violated");
Line 1360  ip_forward(struct mbuf *m, int srcrt, st
Line 1219  ip_forward(struct mbuf *m, int srcrt, st
                 return;                  return;
         }          }
   
           SOFTNET_LOCK();
   
         if (ip->ip_ttl <= IPTTLDEC) {          if (ip->ip_ttl <= IPTTLDEC) {
                 icmp_error(m, ICMP_TIMXCEED, ICMP_TIMXCEED_INTRANS, dest, 0);                  icmp_error(m, ICMP_TIMXCEED, ICMP_TIMXCEED_INTRANS, dest, 0);
                   SOFTNET_UNLOCK();
                 return;                  return;
         }          }
   
         sockaddr_in_init(&u.dst4, &ip->ip_dst, 0);          sockaddr_in_init(&u.dst4, &ip->ip_dst, 0);
   
         ro = percpu_getref(ipforward_rt_percpu);          if ((rt = rtcache_lookup(&ipforward_rt, &u.dst)) == NULL) {
         rt = rtcache_lookup(ro, &u.dst);  
         if (rt == NULL) {  
                 percpu_putref(ipforward_rt_percpu);  
                 icmp_error(m, ICMP_UNREACH, ICMP_UNREACH_NET, dest, 0);                  icmp_error(m, ICMP_UNREACH, ICMP_UNREACH_NET, dest, 0);
                   SOFTNET_UNLOCK();
                 return;                  return;
         }          }
   
Line 1394  ip_forward(struct mbuf *m, int srcrt, st
Line 1254  ip_forward(struct mbuf *m, int srcrt, st
          * Also, don't send redirect if forwarding using a default route           * Also, don't send redirect if forwarding using a default route
          * or a route modified by a redirect.           * or a route modified by a redirect.
          */           */
         if (rt->rt_ifp == rcvif &&          if (rt->rt_ifp == m->m_pkthdr.rcvif &&
             (rt->rt_flags & (RTF_DYNAMIC|RTF_MODIFIED)) == 0 &&              (rt->rt_flags & (RTF_DYNAMIC|RTF_MODIFIED)) == 0 &&
             !in_nullhost(satocsin(rt_getkey(rt))->sin_addr) &&              !in_nullhost(satocsin(rt_getkey(rt))->sin_addr) &&
             ipsendredirects && !srcrt) {              ipsendredirects && !srcrt) {
Line 1413  ip_forward(struct mbuf *m, int srcrt, st
Line 1273  ip_forward(struct mbuf *m, int srcrt, st
                         code = ICMP_REDIRECT_HOST;                          code = ICMP_REDIRECT_HOST;
                 }                  }
         }          }
         rtcache_unref(rt, ro);  
   
         error = ip_output(m, NULL, ro,          error = ip_output(m, NULL, &ipforward_rt,
             (IP_FORWARDING | (ip_directedbcast ? IP_ALLOWBROADCAST : 0)),              (IP_FORWARDING | (ip_directedbcast ? IP_ALLOWBROADCAST : 0)),
             NULL, NULL);              NULL, NULL);
   
Line 1437  ip_forward(struct mbuf *m, int srcrt, st
Line 1296  ip_forward(struct mbuf *m, int srcrt, st
         if (mcopy) {          if (mcopy) {
 #ifdef GATEWAY  #ifdef GATEWAY
                 if (mcopy->m_flags & M_CANFASTFWD)                  if (mcopy->m_flags & M_CANFASTFWD)
                         ipflow_create(ro, mcopy);                          ipflow_create(&ipforward_rt, mcopy);
 #endif  #endif
                 m_freem(mcopy);                  m_freem(mcopy);
         }          }
   
         percpu_putref(ipforward_rt_percpu);          SOFTNET_UNLOCK();
         return;          return;
   
 redirect:  redirect:
 error:  error:
         if (mcopy == NULL) {          if (mcopy == NULL) {
                 percpu_putref(ipforward_rt_percpu);                  SOFTNET_UNLOCK();
                 return;                  return;
         }          }
   
Line 1471  error:
Line 1330  error:
                 type = ICMP_UNREACH;                  type = ICMP_UNREACH;
                 code = ICMP_UNREACH_NEEDFRAG;                  code = ICMP_UNREACH_NEEDFRAG;
   
                 if ((rt = rtcache_validate(ro)) != NULL) {                  if ((rt = rtcache_validate(&ipforward_rt)) != NULL)
                         destmtu = rt->rt_ifp->if_mtu;                          destmtu = rt->rt_ifp->if_mtu;
                         rtcache_unref(rt, ro);  
                 }  
 #ifdef IPSEC  #ifdef IPSEC
                 if (ipsec_used)                  if (ipsec_used)
                         (void)ipsec4_forward(mcopy, &destmtu);                          (void)ipsec4_forward(mcopy, &destmtu);
Line 1491  error:
Line 1348  error:
                  */                   */
                 if (mcopy)                  if (mcopy)
                         m_freem(mcopy);                          m_freem(mcopy);
                 percpu_putref(ipforward_rt_percpu);                  SOFTNET_UNLOCK();
                 return;                  return;
         }          }
         icmp_error(mcopy, type, code, dest, destmtu);          icmp_error(mcopy, type, code, dest, destmtu);
         percpu_putref(ipforward_rt_percpu);          SOFTNET_UNLOCK();
 }  }
   
 void  void
Line 1503  ip_savecontrol(struct inpcb *inp, struct
Line 1360  ip_savecontrol(struct inpcb *inp, struct
     struct mbuf *m)      struct mbuf *m)
 {  {
         struct socket *so = inp->inp_socket;          struct socket *so = inp->inp_socket;
           ifnet_t *ifp = m->m_pkthdr.rcvif;
         int inpflags = inp->inp_flags;          int inpflags = inp->inp_flags;
   
         if (SOOPT_TIMESTAMP(so->so_options))          if (so->so_options & SO_TIMESTAMP
                 mp = sbsavetimestamp(so->so_options, m, mp);  #ifdef SO_OTIMESTAMP
               || so->so_options & SO_OTIMESTAMP
         if (inpflags & INP_RECVDSTADDR) {  #endif
                 *mp = sbcreatecontrol(&ip->ip_dst,              ) {
                     sizeof(struct in_addr), IP_RECVDSTADDR, IPPROTO_IP);                  struct timeval tv;
   
                   microtime(&tv);
   #ifdef SO_OTIMESTAMP
                   if (so->so_options & SO_OTIMESTAMP) {
                           struct timeval50 tv50;
                           timeval_to_timeval50(&tv, &tv50);
                           *mp = sbcreatecontrol((void *) &tv50, sizeof(tv50),
                               SCM_OTIMESTAMP, SOL_SOCKET);
                   } else
   #endif
                   *mp = sbcreatecontrol((void *) &tv, sizeof(tv),
                       SCM_TIMESTAMP, SOL_SOCKET);
                 if (*mp)                  if (*mp)
                         mp = &(*mp)->m_next;                          mp = &(*mp)->m_next;
         }          }
           if (inpflags & INP_RECVDSTADDR) {
         if (inpflags & INP_RECVTTL) {                  *mp = sbcreatecontrol((void *) &ip->ip_dst,
                 *mp = sbcreatecontrol(&ip->ip_ttl,                      sizeof(struct in_addr), IP_RECVDSTADDR, IPPROTO_IP);
                     sizeof(uint8_t), IP_RECVTTL, IPPROTO_IP);  
                 if (*mp)                  if (*mp)
                         mp = &(*mp)->m_next;                          mp = &(*mp)->m_next;
         }          }
   
         struct psref psref;  
         ifnet_t *ifp = m_get_rcvif_psref(m, &psref);  
         if (__predict_false(ifp == NULL)) {  
 #ifdef DIAGNOSTIC  
                 printf("%s: missing receive interface\n", __func__);  
 #endif  
                 return; /* XXX should report error? */  
         }  
   
         if (inpflags & INP_RECVPKTINFO) {          if (inpflags & INP_RECVPKTINFO) {
                 struct in_pktinfo ipi;                  struct in_pktinfo ipi;
                 ipi.ipi_addr = ip->ip_src;                  ipi.ipi_addr = ip->ip_src;
                 ipi.ipi_ifindex = ifp->if_index;                  ipi.ipi_ifindex = ifp->if_index;
                 *mp = sbcreatecontrol(&ipi,                  *mp = sbcreatecontrol((void *) &ipi,
                     sizeof(ipi), IP_RECVPKTINFO, IPPROTO_IP);                      sizeof(ipi), IP_RECVPKTINFO, IPPROTO_IP);
                 if (*mp)                  if (*mp)
                         mp = &(*mp)->m_next;                          mp = &(*mp)->m_next;
Line 1544  ip_savecontrol(struct inpcb *inp, struct
Line 1403  ip_savecontrol(struct inpcb *inp, struct
                 struct in_pktinfo ipi;                  struct in_pktinfo ipi;
                 ipi.ipi_addr = ip->ip_dst;                  ipi.ipi_addr = ip->ip_dst;
                 ipi.ipi_ifindex = ifp->if_index;                  ipi.ipi_ifindex = ifp->if_index;
                 *mp = sbcreatecontrol(&ipi,                  *mp = sbcreatecontrol((void *) &ipi,
                     sizeof(ipi), IP_PKTINFO, IPPROTO_IP);                      sizeof(ipi), IP_PKTINFO, IPPROTO_IP);
                 if (*mp)                  if (*mp)
                         mp = &(*mp)->m_next;                          mp = &(*mp)->m_next;
Line 1552  ip_savecontrol(struct inpcb *inp, struct
Line 1411  ip_savecontrol(struct inpcb *inp, struct
         if (inpflags & INP_RECVIF) {          if (inpflags & INP_RECVIF) {
                 struct sockaddr_dl sdl;                  struct sockaddr_dl sdl;
   
                 sockaddr_dl_init(&sdl, sizeof(sdl), ifp->if_index, 0, NULL, 0,                  sockaddr_dl_init(&sdl, sizeof(sdl), ifp ?
                     NULL, 0);                      ifp->if_index : 0, 0, NULL, 0, NULL, 0);
                 *mp = sbcreatecontrol(&sdl, sdl.sdl_len, IP_RECVIF, IPPROTO_IP);                  *mp = sbcreatecontrol(&sdl, sdl.sdl_len, IP_RECVIF, IPPROTO_IP);
                 if (*mp)                  if (*mp)
                         mp = &(*mp)->m_next;                          mp = &(*mp)->m_next;
         }          }
         m_put_rcvif_psref(ifp, &psref);          if (inpflags & INP_RECVTTL) {
                   *mp = sbcreatecontrol((void *) &ip->ip_ttl,
                       sizeof(uint8_t), IP_RECVTTL, IPPROTO_IP);
                   if (*mp)
                           mp = &(*mp)->m_next;
           }
 }  }
   
 /*  /*
Line 1597  sysctl_net_inet_ip_pmtudto(SYSCTLFN_ARGS
Line 1461  sysctl_net_inet_ip_pmtudto(SYSCTLFN_ARGS
         int error, tmp;          int error, tmp;
         struct sysctlnode node;          struct sysctlnode node;
   
         icmp_mtudisc_lock();  
   
         node = *rnode;          node = *rnode;
         tmp = ip_mtudisc_timeout;          tmp = ip_mtudisc_timeout;
         node.sysctl_data = &tmp;          node.sysctl_data = &tmp;
         error = sysctl_lookup(SYSCTLFN_CALL(&node));          error = sysctl_lookup(SYSCTLFN_CALL(&node));
         if (error || newp == NULL)          if (error || newp == NULL)
                 goto out;                  return (error);
         if (tmp < 0) {          if (tmp < 0)
                 error = EINVAL;                  return (EINVAL);
                 goto out;  
         }          mutex_enter(softnet_lock);
   
         ip_mtudisc_timeout = tmp;          ip_mtudisc_timeout = tmp;
         rt_timer_queue_change(ip_mtudisc_timeout_q, ip_mtudisc_timeout);          rt_timer_queue_change(ip_mtudisc_timeout_q, ip_mtudisc_timeout);
         error = 0;  
 out:          mutex_exit(softnet_lock);
         icmp_mtudisc_unlock();  
         return error;          return (0);
 }  }
   
 static int  static int

Legend:
Removed from v.1.302.2.4  
changed lines
  Added in v.1.328

CVSweb <webmaster@jp.NetBSD.org>