[BACK]Return to ip_input.c CVS log [TXT][DIR] Up to [cvs.NetBSD.org] / src / sys / netinet

Please note that diffs are not public domain; they are subject to the copyright notices on the relevant files.

Diff for /src/sys/netinet/ip_input.c between version 1.337.2.1 and 1.360

version 1.337.2.1, 2016/08/06 00:19:10 version 1.360, 2017/07/27 06:59:28
Line 95  __KERNEL_RCSID(0, "$NetBSD$");
Line 95  __KERNEL_RCSID(0, "$NetBSD$");
   
 #ifdef _KERNEL_OPT  #ifdef _KERNEL_OPT
 #include "opt_inet.h"  #include "opt_inet.h"
 #include "opt_compat_netbsd.h"  
 #include "opt_gateway.h"  #include "opt_gateway.h"
 #include "opt_ipsec.h"  #include "opt_ipsec.h"
 #include "opt_mrouting.h"  #include "opt_mrouting.h"
 #include "opt_mbuftrace.h"  #include "opt_mbuftrace.h"
 #include "opt_inet_csum.h"  #include "opt_inet_csum.h"
   #include "opt_net_mpsafe.h"
 #endif  #endif
   
 #include "arp.h"  #include "arp.h"
Line 173  __KERNEL_RCSID(0, "$NetBSD$");
Line 173  __KERNEL_RCSID(0, "$NetBSD$");
 #define IPMTUDISCTIMEOUT (10 * 60)      /* as per RFC 1191 */  #define IPMTUDISCTIMEOUT (10 * 60)      /* as per RFC 1191 */
 #endif  #endif
   
 #ifdef COMPAT_50  
 #include <compat/sys/time.h>  
 #include <compat/sys/socket.h>  
 #endif  
   
 /*  /*
  * Note: DIRECTED_BROADCAST is handled this way so that previous   * Note: DIRECTED_BROADCAST is handled this way so that previous
  * configuration using this option will Just Work.   * configuration using this option will Just Work.
Line 225  pfil_head_t *  inet_pfil_hook  __read_mo
Line 220  pfil_head_t *  inet_pfil_hook  __read_mo
 ipid_state_t *          ip_ids                  __read_mostly;  ipid_state_t *          ip_ids                  __read_mostly;
 percpu_t *              ipstat_percpu           __read_mostly;  percpu_t *              ipstat_percpu           __read_mostly;
   
 static struct route     ipforward_rt            __cacheline_aligned;  static percpu_t         *ipforward_rt_percpu    __cacheline_aligned;
   
 uint16_t ip_id;  uint16_t ip_id;
   
Line 252  EVCNT_ATTACH_STATIC(ip_swcsum);
Line 247  EVCNT_ATTACH_STATIC(ip_swcsum);
 #endif /* INET_CSUM_COUNTERS */  #endif /* INET_CSUM_COUNTERS */
   
 /*  /*
  * We need to save the IP options in case a protocol wants to respond   * Used to save the IP options in case a protocol wants to respond
  * to an incoming packet over the same route if the packet got here   * to an incoming packet over the same route if the packet got here
  * using IP source routing.  This allows connection establishment and   * using IP source routing.  This allows connection establishment and
  * maintenance when the remote end is on a network that is not known   * maintenance when the remote end is on a network that is not known
  * to us.   * to us.
  */   */
   struct ip_srcrt {
 static int      ip_nhops = 0;          int             isr_nhops;                 /* number of hops */
           struct in_addr  isr_dst;                   /* final destination */
 static  struct ip_srcrt {          char            isr_nop;                   /* one NOP to align */
         struct  in_addr dst;                    /* final destination */          char            isr_hdr[IPOPT_OFFSET + 1]; /* OPTVAL, OLEN & OFFSET */
         char    nop;                            /* one NOP to align */          struct in_addr  isr_routes[MAX_IPOPTLEN/sizeof(struct in_addr)];
         char    srcopt[IPOPT_OFFSET + 1];       /* OPTVAL, OLEN and OFFSET */  };
         struct  in_addr route[MAX_IPOPTLEN/sizeof(struct in_addr)];  
 } ip_srcrt;  
   
 static int ip_drainwanted;  static int ip_drainwanted;
   
 struct  sockaddr_in ipaddr = {  static void save_rte(struct mbuf *, u_char *, struct in_addr);
         .sin_len = sizeof(ipaddr),  
         .sin_family = AF_INET,  
 };  
   
 static void save_rte(u_char *, struct in_addr);  
   
 #ifdef MBUFTRACE  #ifdef MBUFTRACE
 struct mowner ip_rx_mowner = MOWNER_INIT("internet", "rx");  struct mowner ip_rx_mowner = MOWNER_INIT("internet", "rx");
Line 286  static void  ipintr(void *);
Line 274  static void  ipintr(void *);
 static void             ip_input(struct mbuf *);  static void             ip_input(struct mbuf *);
 static void             ip_forward(struct mbuf *, int, struct ifnet *);  static void             ip_forward(struct mbuf *, int, struct ifnet *);
 static bool             ip_dooptions(struct mbuf *);  static bool             ip_dooptions(struct mbuf *);
 static struct in_ifaddr *ip_rtaddr(struct in_addr);  static struct in_ifaddr *ip_rtaddr(struct in_addr, struct psref *);
 static void             sysctl_net_inet_ip_setup(struct sysctllog **);  static void             sysctl_net_inet_ip_setup(struct sysctllog **);
   
 static struct in_ifaddr *ip_match_our_address(struct ifnet *, struct ip *,  static struct in_ifaddr *ip_match_our_address(struct ifnet *, struct ip *,
Line 294  static struct in_ifaddr *ip_match_our_ad
Line 282  static struct in_ifaddr *ip_match_our_ad
 static struct in_ifaddr *ip_match_our_address_broadcast(struct ifnet *,  static struct in_ifaddr *ip_match_our_address_broadcast(struct ifnet *,
                             struct ip *);                              struct ip *);
   
 /* XXX: Not yet enabled. */  #ifdef NET_MPSAFE
   #define SOFTNET_LOCK()          mutex_enter(softnet_lock)
   #define SOFTNET_UNLOCK()        mutex_exit(softnet_lock)
   #else
 #define SOFTNET_LOCK()          KASSERT(mutex_owned(softnet_lock))  #define SOFTNET_LOCK()          KASSERT(mutex_owned(softnet_lock))
 #define SOFTNET_UNLOCK()        KASSERT(mutex_owned(softnet_lock))  #define SOFTNET_UNLOCK()        KASSERT(mutex_owned(softnet_lock))
   #endif
   
 /*  /*
  * IP initialization: fill in IP protocol switch table.   * IP initialization: fill in IP protocol switch table.
Line 330  ip_init(void)
Line 322  ip_init(void)
         ip_ids = ip_id_init();          ip_ids = ip_id_init();
         ip_id = time_uptime & 0xfffff;          ip_id = time_uptime & 0xfffff;
   
         ip_mtudisc_timeout_q = rt_timer_queue_create(ip_mtudisc_timeout);  
 #ifdef GATEWAY  #ifdef GATEWAY
         ipflow_init();          ipflow_init();
 #endif  #endif
Line 345  ip_init(void)
Line 336  ip_init(void)
 #endif /* MBUFTRACE */  #endif /* MBUFTRACE */
   
         ipstat_percpu = percpu_alloc(sizeof(uint64_t) * IP_NSTATS);          ipstat_percpu = percpu_alloc(sizeof(uint64_t) * IP_NSTATS);
           ipforward_rt_percpu = percpu_alloc(sizeof(struct route));
           ip_mtudisc_timeout_q = rt_timer_queue_create(ip_mtudisc_timeout);
 }  }
   
 static struct in_ifaddr *  static struct in_ifaddr *
Line 378  ip_match_our_address(struct ifnet *ifp, 
Line 371  ip_match_our_address(struct ifnet *ifp, 
                                 continue;                                  continue;
                         if (checkif && ia->ia_ifp != ifp)                          if (checkif && ia->ia_ifp != ifp)
                                 continue;                                  continue;
                         if ((ia->ia_ifp->if_flags & IFF_UP) != 0)                          if ((ia->ia_ifp->if_flags & IFF_UP) != 0 &&
                               (ia->ia4_flags & IN_IFF_DETACHED) == 0)
                                 break;                                  break;
                         else                          else
                                 (*downmatch)++;                                  (*downmatch)++;
Line 398  ip_match_our_address_broadcast(struct if
Line 392  ip_match_our_address_broadcast(struct if
                 if (ifa->ifa_addr->sa_family != AF_INET)                  if (ifa->ifa_addr->sa_family != AF_INET)
                         continue;                          continue;
                 ia = ifatoia(ifa);                  ia = ifatoia(ifa);
                 if (ia->ia4_flags & IN_IFF_NOTREADY)                  if (ia->ia4_flags & (IN_IFF_NOTREADY | IN_IFF_DETACHED))
                         continue;                          continue;
                 if (in_hosteq(ip->ip_dst, ia->ia_broadaddr.sin_addr) ||                  if (in_hosteq(ip->ip_dst, ia->ia_broadaddr.sin_addr) ||
                     in_hosteq(ip->ip_dst, ia->ia_netbroadcast) ||                      in_hosteq(ip->ip_dst, ia->ia_netbroadcast) ||
Line 432  ipintr(void *arg __unused)
Line 426  ipintr(void *arg __unused)
   
         KASSERT(cpu_softintr_p());          KASSERT(cpu_softintr_p());
   
   #ifndef NET_MPSAFE
         mutex_enter(softnet_lock);          mutex_enter(softnet_lock);
   #endif
         while ((m = pktq_dequeue(ip_pktq)) != NULL) {          while ((m = pktq_dequeue(ip_pktq)) != NULL) {
                 ip_input(m);                  ip_input(m);
         }          }
   #ifndef NET_MPSAFE
         mutex_exit(softnet_lock);          mutex_exit(softnet_lock);
   #endif
 }  }
   
 /*  /*
Line 609  ip_input(struct mbuf *m)
Line 607  ip_input(struct mbuf *m)
                 struct in_addr odst = ip->ip_dst;                  struct in_addr odst = ip->ip_dst;
                 bool freed;                  bool freed;
   
                 SOFTNET_LOCK();  
                 freed = pfil_run_hooks(inet_pfil_hook, &m, ifp, PFIL_IN) != 0;                  freed = pfil_run_hooks(inet_pfil_hook, &m, ifp, PFIL_IN) != 0;
                 SOFTNET_UNLOCK();  
                 if (freed || m == NULL) {                  if (freed || m == NULL) {
                           m = NULL;
                         goto out;                          goto out;
                 }                  }
                 ip = mtod(m, struct ip *);                  ip = mtod(m, struct ip *);
Line 642  ip_input(struct mbuf *m)
Line 639  ip_input(struct mbuf *m)
                 if ((*altq_input)(m, AF_INET) == 0) {                  if ((*altq_input)(m, AF_INET) == 0) {
                         /* Packet dropped by traffic conditioner. */                          /* Packet dropped by traffic conditioner. */
                         SOFTNET_UNLOCK();                          SOFTNET_UNLOCK();
                           m = NULL;
                         goto out;                          goto out;
                 }                  }
                 SOFTNET_UNLOCK();                  SOFTNET_UNLOCK();
Line 654  ip_input(struct mbuf *m)
Line 652  ip_input(struct mbuf *m)
          * error was detected (causing an icmp message           * error was detected (causing an icmp message
          * to be sent and the original packet to be freed).           * to be sent and the original packet to be freed).
          */           */
         ip_nhops = 0;           /* for source routed packets */          if (hlen > sizeof (struct ip) && ip_dooptions(m)) {
         if (hlen > sizeof (struct ip) && ip_dooptions(m))                  m = NULL;
                 goto out;                  goto out;
           }
   
         /*          /*
          * Check our list of addresses, to see if the packet is for us.           * Check our list of addresses, to see if the packet is for us.
Line 753  ip_input(struct mbuf *m)
Line 752  ip_input(struct mbuf *m)
                         return;                          return;
                 }                  }
 #ifdef IPSEC  #ifdef IPSEC
                 /* Perform IPsec, if any. */                  /* Check the security policy (SP) for the packet */
                 if (ipsec_used) {                  if (ipsec_used) {
                         SOFTNET_LOCK();  
                         if (ipsec4_input(m, IP_FORWARDING |                          if (ipsec4_input(m, IP_FORWARDING |
                             (ip_directedbcast ? IP_ALLOWBROADCAST : 0)) != 0) {                              (ip_directedbcast ? IP_ALLOWBROADCAST : 0)) != 0) {
                                 SOFTNET_UNLOCK();  
                                 goto out;                                  goto out;
                         }                          }
                         SOFTNET_UNLOCK();  
                 }                  }
 #endif  #endif
                 ip_forward(m, srcrt, ifp);                  ip_forward(m, srcrt, ifp);
Line 804  ours:
Line 800  ours:
          */           */
         if (ipsec_used &&          if (ipsec_used &&
             (inetsw[ip_protox[ip->ip_p]].pr_flags & PR_LASTHDR) != 0) {              (inetsw[ip_protox[ip->ip_p]].pr_flags & PR_LASTHDR) != 0) {
                 SOFTNET_LOCK();  
                 if (ipsec4_input(m, 0) != 0) {                  if (ipsec4_input(m, 0) != 0) {
                         SOFTNET_UNLOCK();  
                         goto out;                          goto out;
                 }                  }
                 SOFTNET_UNLOCK();  
         }          }
 #endif  #endif
   
Line 824  ours:
Line 817  ours:
                  * is expensive, so explore ia here again.                   * is expensive, so explore ia here again.
                  */                   */
                 s = pserialize_read_enter();                  s = pserialize_read_enter();
                 _ia = in_get_ia(ip->ip_dst.s_addr);                  _ia = in_get_ia(ip->ip_dst);
                 _ia->ia_ifa.ifa_data.ifad_inbytes += ntohs(ip->ip_len);                  _ia->ia_ifa.ifa_data.ifad_inbytes += ntohs(ip->ip_len);
                 pserialize_read_exit(s);                  pserialize_read_exit(s);
         }          }
Line 851  void
Line 844  void
 ip_slowtimo(void)  ip_slowtimo(void)
 {  {
   
   #ifndef NET_MPSAFE
         mutex_enter(softnet_lock);          mutex_enter(softnet_lock);
         KERNEL_LOCK(1, NULL);          KERNEL_LOCK(1, NULL);
   #endif
   
         ip_reass_slowtimo();          ip_reass_slowtimo();
   
   #ifndef NET_MPSAFE
         KERNEL_UNLOCK_ONE(NULL);          KERNEL_UNLOCK_ONE(NULL);
         mutex_exit(softnet_lock);          mutex_exit(softnet_lock);
   #endif
 }  }
   
 /*  /*
Line 889  ip_dooptions(struct mbuf *m)
Line 886  ip_dooptions(struct mbuf *m)
         int opt, optlen, cnt, off, code, type = ICMP_PARAMPROB, forward = 0;          int opt, optlen, cnt, off, code, type = ICMP_PARAMPROB, forward = 0;
         struct in_addr dst;          struct in_addr dst;
         n_time ntime;          n_time ntime;
         struct ifaddr *ifa;          struct ifaddr *ifa = NULL;
         int s;          int s;
   
         dst = ip->ip_dst;          dst = ip->ip_dst;
Line 927  ip_dooptions(struct mbuf *m)
Line 924  ip_dooptions(struct mbuf *m)
                  * address is on directly accessible net.                   * address is on directly accessible net.
                  */                   */
                 case IPOPT_LSRR:                  case IPOPT_LSRR:
                 case IPOPT_SSRR:                  case IPOPT_SSRR: {
                           struct psref psref;
                           struct sockaddr_in ipaddr = {
                               .sin_len = sizeof(ipaddr),
                               .sin_family = AF_INET,
                           };
   
                         if (ip_allowsrcrt == 0) {                          if (ip_allowsrcrt == 0) {
                                 type = ICMP_UNREACH;                                  type = ICMP_UNREACH;
                                 code = ICMP_UNREACH_NET_PROHIB;                                  code = ICMP_UNREACH_NET_PROHIB;
Line 965  ip_dooptions(struct mbuf *m)
Line 968  ip_dooptions(struct mbuf *m)
                                 /*                                  /*
                                  * End of source route.  Should be for us.                                   * End of source route.  Should be for us.
                                  */                                   */
                                 save_rte(cp, ip->ip_src);                                  save_rte(m, cp, ip->ip_src);
                                 break;                                  break;
                         }                          }
                         /*                          /*
Line 973  ip_dooptions(struct mbuf *m)
Line 976  ip_dooptions(struct mbuf *m)
                          */                           */
                         memcpy((void *)&ipaddr.sin_addr, (void *)(cp + off),                          memcpy((void *)&ipaddr.sin_addr, (void *)(cp + off),
                             sizeof(ipaddr.sin_addr));                              sizeof(ipaddr.sin_addr));
                         s = pserialize_read_enter();  
                         if (opt == IPOPT_SSRR) {                          if (opt == IPOPT_SSRR) {
                                 ifa = ifa_ifwithladdr(sintosa(&ipaddr));                                  ifa = ifa_ifwithladdr_psref(sintosa(&ipaddr),
                                       &psref);
                                 if (ifa != NULL)                                  if (ifa != NULL)
                                         ia = ifatoia(ifa);                                          ia = ifatoia(ifa);
                                 else                                  else
                                         ia = NULL;                                          ia = NULL;
                         } else {                          } else {
                                 ia = ip_rtaddr(ipaddr.sin_addr);                                  ia = ip_rtaddr(ipaddr.sin_addr, &psref);
                         }                          }
                         if (ia == NULL) {                          if (ia == NULL) {
                                 type = ICMP_UNREACH;                                  type = ICMP_UNREACH;
                                 code = ICMP_UNREACH_SRCFAIL;                                  code = ICMP_UNREACH_SRCFAIL;
                                 pserialize_read_exit(s);  
                                 goto bad;                                  goto bad;
                         }                          }
                         ip->ip_dst = ipaddr.sin_addr;                          ip->ip_dst = ipaddr.sin_addr;
                         bcopy((void *)&ia->ia_addr.sin_addr,                          bcopy((void *)&ia->ia_addr.sin_addr,
                             (void *)(cp + off), sizeof(struct in_addr));                              (void *)(cp + off), sizeof(struct in_addr));
                         pserialize_read_exit(s);                          ia4_release(ia, &psref);
                         cp[IPOPT_OFFSET] += sizeof(struct in_addr);                          cp[IPOPT_OFFSET] += sizeof(struct in_addr);
                         /*                          /*
                          * Let ip_intr's mcast routing check handle mcast pkts                           * Let ip_intr's mcast routing check handle mcast pkts
                          */                           */
                         forward = !IN_MULTICAST(ip->ip_dst.s_addr);                          forward = !IN_MULTICAST(ip->ip_dst.s_addr);
                         break;                          break;
                       }
   
                   case IPOPT_RR: {
                           struct psref psref;
                           struct sockaddr_in ipaddr = {
                               .sin_len = sizeof(ipaddr),
                               .sin_family = AF_INET,
                           };
   
                 case IPOPT_RR:  
                         if (optlen < IPOPT_OFFSET + sizeof(*cp)) {                          if (optlen < IPOPT_OFFSET + sizeof(*cp)) {
                                 code = &cp[IPOPT_OLEN] - (u_char *)ip;                                  code = &cp[IPOPT_OLEN] - (u_char *)ip;
                                 goto bad;                                  goto bad;
Line 1021  ip_dooptions(struct mbuf *m)
Line 1030  ip_dooptions(struct mbuf *m)
                          * locate outgoing interface; if we're the destination,                           * locate outgoing interface; if we're the destination,
                          * use the incoming interface (should be same).                           * use the incoming interface (should be same).
                          */                           */
                         s = pserialize_read_enter();                          ifa = ifa_ifwithaddr_psref(sintosa(&ipaddr), &psref);
                         ifa = ifa_ifwithaddr(sintosa(&ipaddr));  
                         if (ifa == NULL) {                          if (ifa == NULL) {
                                 ia = ip_rtaddr(ipaddr.sin_addr);                                  ia = ip_rtaddr(ipaddr.sin_addr, &psref);
                                 if (ia == NULL) {                                  if (ia == NULL) {
                                         pserialize_read_exit(s);  
                                         type = ICMP_UNREACH;                                          type = ICMP_UNREACH;
                                         code = ICMP_UNREACH_HOST;                                          code = ICMP_UNREACH_HOST;
                                         goto bad;                                          goto bad;
Line 1036  ip_dooptions(struct mbuf *m)
Line 1043  ip_dooptions(struct mbuf *m)
                         }                          }
                         bcopy((void *)&ia->ia_addr.sin_addr,                          bcopy((void *)&ia->ia_addr.sin_addr,
                             (void *)(cp + off), sizeof(struct in_addr));                              (void *)(cp + off), sizeof(struct in_addr));
                         pserialize_read_exit(s);                          ia4_release(ia, &psref);
                         cp[IPOPT_OFFSET] += sizeof(struct in_addr);                          cp[IPOPT_OFFSET] += sizeof(struct in_addr);
                         break;                          break;
                       }
   
                 case IPOPT_TS:                  case IPOPT_TS:
                         code = cp - (u_char *)ip;                          code = cp - (u_char *)ip;
Line 1068  ip_dooptions(struct mbuf *m)
Line 1076  ip_dooptions(struct mbuf *m)
                         case IPOPT_TS_TSANDADDR: {                          case IPOPT_TS_TSANDADDR: {
                                 struct ifnet *rcvif;                                  struct ifnet *rcvif;
                                 int _s, _ss;                                  int _s, _ss;
                                   struct sockaddr_in ipaddr = {
                                       .sin_len = sizeof(ipaddr),
                                       .sin_family = AF_INET,
                                   };
   
                                 if (ipt->ipt_ptr - 1 + sizeof(n_time) +                                  if (ipt->ipt_ptr - 1 + sizeof(n_time) +
                                     sizeof(struct in_addr) > ipt->ipt_len) {                                      sizeof(struct in_addr) > ipt->ipt_len) {
Line 1078  ip_dooptions(struct mbuf *m)
Line 1090  ip_dooptions(struct mbuf *m)
                                 ipaddr.sin_addr = dst;                                  ipaddr.sin_addr = dst;
                                 _ss = pserialize_read_enter();                                  _ss = pserialize_read_enter();
                                 rcvif = m_get_rcvif(m, &_s);                                  rcvif = m_get_rcvif(m, &_s);
                                 ifa = ifaof_ifpforaddr(sintosa(&ipaddr), rcvif);                                  if (__predict_true(rcvif != NULL)) {
                                           ifa = ifaof_ifpforaddr(sintosa(&ipaddr),
                                               rcvif);
                                   }
                                 m_put_rcvif(rcvif, &_s);                                  m_put_rcvif(rcvif, &_s);
                                 if (ifa == NULL) {                                  if (ifa == NULL) {
                                         pserialize_read_exit(_ss);                                          pserialize_read_exit(_ss);
Line 1092  ip_dooptions(struct mbuf *m)
Line 1107  ip_dooptions(struct mbuf *m)
                                 break;                                  break;
                         }                          }
   
                         case IPOPT_TS_PRESPEC:                          case IPOPT_TS_PRESPEC: {
                                   struct sockaddr_in ipaddr = {
                                       .sin_len = sizeof(ipaddr),
                                       .sin_family = AF_INET,
                                   };
   
                                 if (ipt->ipt_ptr - 1 + sizeof(n_time) +                                  if (ipt->ipt_ptr - 1 + sizeof(n_time) +
                                     sizeof(struct in_addr) > ipt->ipt_len) {                                      sizeof(struct in_addr) > ipt->ipt_len) {
                                         code = (u_char *)&ipt->ipt_ptr -                                          code = (u_char *)&ipt->ipt_ptr -
Line 1110  ip_dooptions(struct mbuf *m)
Line 1130  ip_dooptions(struct mbuf *m)
                                 pserialize_read_exit(s);                                  pserialize_read_exit(s);
                                 ipt->ipt_ptr += sizeof(struct in_addr);                                  ipt->ipt_ptr += sizeof(struct in_addr);
                                 break;                                  break;
                               }
   
                         default:                          default:
                                 /* XXX can't take &ipt->ipt_flg */                                  /* XXX can't take &ipt->ipt_flg */
Line 1156  bad:
Line 1177  bad:
  * return internet address info of interface to be used to get there.   * return internet address info of interface to be used to get there.
  */   */
 static struct in_ifaddr *  static struct in_ifaddr *
 ip_rtaddr(struct in_addr dst)  ip_rtaddr(struct in_addr dst, struct psref *psref)
 {  {
         struct rtentry *rt;          struct rtentry *rt;
         union {          union {
                 struct sockaddr         dst;                  struct sockaddr         dst;
                 struct sockaddr_in      dst4;                  struct sockaddr_in      dst4;
         } u;          } u;
           struct route *ro;
   
         sockaddr_in_init(&u.dst4, &dst, 0);          sockaddr_in_init(&u.dst4, &dst, 0);
   
         SOFTNET_LOCK();          ro = percpu_getref(ipforward_rt_percpu);
         rt = rtcache_lookup(&ipforward_rt, &u.dst);          rt = rtcache_lookup(ro, &u.dst);
         SOFTNET_UNLOCK();          if (rt == NULL) {
         if (rt == NULL)                  percpu_putref(ipforward_rt_percpu);
                 return NULL;                  return NULL;
           }
   
           ia4_acquire(ifatoia(rt->rt_ifa), psref);
           rtcache_unref(rt, ro);
           percpu_putref(ipforward_rt_percpu);
   
         return ifatoia(rt->rt_ifa);          return ifatoia(rt->rt_ifa);
 }  }
Line 1180  ip_rtaddr(struct in_addr dst)
Line 1207  ip_rtaddr(struct in_addr dst)
  * up later by ip_srcroute if the receiver is interested.   * up later by ip_srcroute if the receiver is interested.
  */   */
 static void  static void
 save_rte(u_char *option, struct in_addr dst)  save_rte(struct mbuf *m, u_char *option, struct in_addr dst)
 {  {
           struct ip_srcrt *isr;
           struct m_tag *mtag;
         unsigned olen;          unsigned olen;
   
         olen = option[IPOPT_OLEN];          olen = option[IPOPT_OLEN];
         if (olen > sizeof(ip_srcrt) - (1 + sizeof(dst)))          if (olen > sizeof(isr->isr_hdr) + sizeof(isr->isr_routes))
                   return;
   
           mtag = m_tag_get(PACKET_TAG_SRCROUTE, sizeof(*isr), M_NOWAIT);
           if (mtag == NULL)
                 return;                  return;
         memcpy((void *)ip_srcrt.srcopt, (void *)option, olen);          isr = (struct ip_srcrt *)(mtag + 1);
         ip_nhops = (olen - IPOPT_OFFSET - 1) / sizeof(struct in_addr);  
         ip_srcrt.dst = dst;          memcpy(isr->isr_hdr, option, olen);
           isr->isr_nhops = (olen - IPOPT_OFFSET - 1) / sizeof(struct in_addr);
           isr->isr_dst = dst;
           m_tag_prepend(m, mtag);
 }  }
   
 /*  /*
Line 1198  save_rte(u_char *option, struct in_addr 
Line 1234  save_rte(u_char *option, struct in_addr 
  * The first hop is placed before the options, will be removed later.   * The first hop is placed before the options, will be removed later.
  */   */
 struct mbuf *  struct mbuf *
 ip_srcroute(void)  ip_srcroute(struct mbuf *m0)
 {  {
         struct in_addr *p, *q;          struct in_addr *p, *q;
         struct mbuf *m;          struct mbuf *m;
           struct ip_srcrt *isr;
           struct m_tag *mtag;
   
           mtag = m_tag_find(m0, PACKET_TAG_SRCROUTE, NULL);
           if (mtag == NULL)
                   return NULL;
           isr = (struct ip_srcrt *)(mtag + 1);
   
         if (ip_nhops == 0)          if (isr->isr_nhops == 0)
                 return NULL;                  return NULL;
   
         m = m_get(M_DONTWAIT, MT_SOOPTS);          m = m_get(M_DONTWAIT, MT_SOOPTS);
         if (m == 0)          if (m == NULL)
                 return NULL;                  return NULL;
   
         MCLAIM(m, &inetdomain.dom_mowner);          MCLAIM(m, &inetdomain.dom_mowner);
 #define OPTSIZ  (sizeof(ip_srcrt.nop) + sizeof(ip_srcrt.srcopt))  #define OPTSIZ  (sizeof(isr->isr_nop) + sizeof(isr->isr_hdr))
   
         /* length is (nhops+1)*sizeof(addr) + sizeof(nop + srcrt header) */          /* length is (nhops+1)*sizeof(addr) + sizeof(nop + header) */
         m->m_len = ip_nhops * sizeof(struct in_addr) + sizeof(struct in_addr) +          m->m_len = (isr->isr_nhops + 1) * sizeof(struct in_addr) + OPTSIZ;
             OPTSIZ;  
   
         /*          /*
          * First save first hop for return route           * First save first hop for return route
          */           */
         p = &ip_srcrt.route[ip_nhops - 1];          p = &(isr->isr_routes[isr->isr_nhops - 1]);
         *(mtod(m, struct in_addr *)) = *p--;          *(mtod(m, struct in_addr *)) = *p--;
   
         /*          /*
          * Copy option fields and padding (nop) to mbuf.           * Copy option fields and padding (nop) to mbuf.
          */           */
         ip_srcrt.nop = IPOPT_NOP;          isr->isr_nop = IPOPT_NOP;
         ip_srcrt.srcopt[IPOPT_OFFSET] = IPOPT_MINOFF;          isr->isr_hdr[IPOPT_OFFSET] = IPOPT_MINOFF;
         memmove(mtod(m, char *) + sizeof(struct in_addr), &ip_srcrt.nop,          memmove(mtod(m, char *) + sizeof(struct in_addr), &isr->isr_nop,
             OPTSIZ);              OPTSIZ);
         q = (struct in_addr *)(mtod(m, char *) +          q = (struct in_addr *)(mtod(m, char *) +
             sizeof(struct in_addr) + OPTSIZ);              sizeof(struct in_addr) + OPTSIZ);
Line 1236  ip_srcroute(void)
Line 1279  ip_srcroute(void)
          * Record return path as an IP source route,           * Record return path as an IP source route,
          * reversing the path (pointers are now aligned).           * reversing the path (pointers are now aligned).
          */           */
         while (p >= ip_srcrt.route) {          while (p >= isr->isr_routes) {
                 *q++ = *p--;                  *q++ = *p--;
         }          }
         /*          /*
          * Last hop goes to final destination.           * Last hop goes to final destination.
          */           */
         *q = ip_srcrt.dst;          *q = isr->isr_dst;
         return (m);          m_tag_delete(m0, mtag);
           return m;
 }  }
   
 const int inetctlerrmap[PRC_NCMDS] = {  const int inetctlerrmap[PRC_NCMDS] = {
Line 1300  ip_forward(struct mbuf *m, int srcrt, st
Line 1344  ip_forward(struct mbuf *m, int srcrt, st
                 struct sockaddr_in      dst4;                  struct sockaddr_in      dst4;
         } u;          } u;
         uint64_t *ips;          uint64_t *ips;
           struct route *ro;
   
         KASSERTMSG(cpu_softintr_p(), "ip_forward: not in the software "          KASSERTMSG(cpu_softintr_p(), "ip_forward: not in the software "
             "interrupt handler; synchronization assumptions violated");              "interrupt handler; synchronization assumptions violated");
Line 1321  ip_forward(struct mbuf *m, int srcrt, st
Line 1366  ip_forward(struct mbuf *m, int srcrt, st
                 return;                  return;
         }          }
   
         SOFTNET_LOCK();  
   
         if (ip->ip_ttl <= IPTTLDEC) {          if (ip->ip_ttl <= IPTTLDEC) {
                 icmp_error(m, ICMP_TIMXCEED, ICMP_TIMXCEED_INTRANS, dest, 0);                  icmp_error(m, ICMP_TIMXCEED, ICMP_TIMXCEED_INTRANS, dest, 0);
                 SOFTNET_UNLOCK();  
                 return;                  return;
         }          }
   
         sockaddr_in_init(&u.dst4, &ip->ip_dst, 0);          sockaddr_in_init(&u.dst4, &ip->ip_dst, 0);
   
         if ((rt = rtcache_lookup(&ipforward_rt, &u.dst)) == NULL) {          ro = percpu_getref(ipforward_rt_percpu);
           rt = rtcache_lookup(ro, &u.dst);
           if (rt == NULL) {
                   percpu_putref(ipforward_rt_percpu);
                 icmp_error(m, ICMP_UNREACH, ICMP_UNREACH_NET, dest, 0);                  icmp_error(m, ICMP_UNREACH, ICMP_UNREACH_NET, dest, 0);
                 SOFTNET_UNLOCK();  
                 return;                  return;
         }          }
   
Line 1375  ip_forward(struct mbuf *m, int srcrt, st
Line 1419  ip_forward(struct mbuf *m, int srcrt, st
                         code = ICMP_REDIRECT_HOST;                          code = ICMP_REDIRECT_HOST;
                 }                  }
         }          }
           rtcache_unref(rt, ro);
   
         error = ip_output(m, NULL, &ipforward_rt,          error = ip_output(m, NULL, ro,
             (IP_FORWARDING | (ip_directedbcast ? IP_ALLOWBROADCAST : 0)),              (IP_FORWARDING | (ip_directedbcast ? IP_ALLOWBROADCAST : 0)),
             NULL, NULL);              NULL, NULL);
   
Line 1398  ip_forward(struct mbuf *m, int srcrt, st
Line 1443  ip_forward(struct mbuf *m, int srcrt, st
         if (mcopy) {          if (mcopy) {
 #ifdef GATEWAY  #ifdef GATEWAY
                 if (mcopy->m_flags & M_CANFASTFWD)                  if (mcopy->m_flags & M_CANFASTFWD)
                         ipflow_create(&ipforward_rt, mcopy);                          ipflow_create(ro, mcopy);
 #endif  #endif
                 m_freem(mcopy);                  m_freem(mcopy);
         }          }
   
         SOFTNET_UNLOCK();          percpu_putref(ipforward_rt_percpu);
         return;          return;
   
 redirect:  redirect:
 error:  error:
         if (mcopy == NULL) {          if (mcopy == NULL) {
                 SOFTNET_UNLOCK();                  percpu_putref(ipforward_rt_percpu);
                 return;                  return;
         }          }
   
Line 1432  error:
Line 1477  error:
                 type = ICMP_UNREACH;                  type = ICMP_UNREACH;
                 code = ICMP_UNREACH_NEEDFRAG;                  code = ICMP_UNREACH_NEEDFRAG;
   
                 if ((rt = rtcache_validate(&ipforward_rt)) != NULL)                  if ((rt = rtcache_validate(ro)) != NULL) {
                         destmtu = rt->rt_ifp->if_mtu;                          destmtu = rt->rt_ifp->if_mtu;
                           rtcache_unref(rt, ro);
                   }
 #ifdef IPSEC  #ifdef IPSEC
                 if (ipsec_used)                  if (ipsec_used)
                         (void)ipsec4_forward(mcopy, &destmtu);                          (void)ipsec4_forward(mcopy, &destmtu);
Line 1450  error:
Line 1497  error:
                  */                   */
                 if (mcopy)                  if (mcopy)
                         m_freem(mcopy);                          m_freem(mcopy);
                 SOFTNET_UNLOCK();                  percpu_putref(ipforward_rt_percpu);
                 return;                  return;
         }          }
         icmp_error(mcopy, type, code, dest, destmtu);          icmp_error(mcopy, type, code, dest, destmtu);
         SOFTNET_UNLOCK();          percpu_putref(ipforward_rt_percpu);
 }  }
   
 void  void
Line 1462  ip_savecontrol(struct inpcb *inp, struct
Line 1509  ip_savecontrol(struct inpcb *inp, struct
     struct mbuf *m)      struct mbuf *m)
 {  {
         struct socket *so = inp->inp_socket;          struct socket *so = inp->inp_socket;
         ifnet_t *ifp;  
         int inpflags = inp->inp_flags;          int inpflags = inp->inp_flags;
         struct psref psref;  
   
         ifp = m_get_rcvif_psref(m, &psref);          if (SOOPT_TIMESTAMP(so->so_options))
         if (__predict_false(ifp == NULL))                  mp = sbsavetimestamp(so->so_options, m, mp);
                 return; /* XXX should report error? */  
   
         if (so->so_options & SO_TIMESTAMP          if (inpflags & INP_RECVDSTADDR) {
 #ifdef SO_OTIMESTAMP                  *mp = sbcreatecontrol(&ip->ip_dst,
             || so->so_options & SO_OTIMESTAMP                      sizeof(struct in_addr), IP_RECVDSTADDR, IPPROTO_IP);
 #endif  
             ) {  
                 struct timeval tv;  
   
                 microtime(&tv);  
 #ifdef SO_OTIMESTAMP  
                 if (so->so_options & SO_OTIMESTAMP) {  
                         struct timeval50 tv50;  
                         timeval_to_timeval50(&tv, &tv50);  
                         *mp = sbcreatecontrol((void *) &tv50, sizeof(tv50),  
                             SCM_OTIMESTAMP, SOL_SOCKET);  
                 } else  
 #endif  
                 *mp = sbcreatecontrol((void *) &tv, sizeof(tv),  
                     SCM_TIMESTAMP, SOL_SOCKET);  
                 if (*mp)                  if (*mp)
                         mp = &(*mp)->m_next;                          mp = &(*mp)->m_next;
         }          }
         if (inpflags & INP_RECVDSTADDR) {  
                 *mp = sbcreatecontrol((void *) &ip->ip_dst,          if (inpflags & INP_RECVTTL) {
                     sizeof(struct in_addr), IP_RECVDSTADDR, IPPROTO_IP);                  *mp = sbcreatecontrol(&ip->ip_ttl,
                       sizeof(uint8_t), IP_RECVTTL, IPPROTO_IP);
                 if (*mp)                  if (*mp)
                         mp = &(*mp)->m_next;                          mp = &(*mp)->m_next;
         }          }
   
           struct psref psref;
           ifnet_t *ifp = m_get_rcvif_psref(m, &psref);
           if (__predict_false(ifp == NULL)) {
   #ifdef DIAGNOSTIC
                   printf("%s: missing receive interface\n", __func__);
   #endif
                   return; /* XXX should report error? */
           }
   
         if (inpflags & INP_RECVPKTINFO) {          if (inpflags & INP_RECVPKTINFO) {
                 struct in_pktinfo ipi;                  struct in_pktinfo ipi;
                 ipi.ipi_addr = ip->ip_src;                  ipi.ipi_addr = ip->ip_src;
                 ipi.ipi_ifindex = ifp->if_index;                  ipi.ipi_ifindex = ifp->if_index;
                 *mp = sbcreatecontrol((void *) &ipi,                  *mp = sbcreatecontrol(&ipi,
                     sizeof(ipi), IP_RECVPKTINFO, IPPROTO_IP);                      sizeof(ipi), IP_RECVPKTINFO, IPPROTO_IP);
                 if (*mp)                  if (*mp)
                         mp = &(*mp)->m_next;                          mp = &(*mp)->m_next;
Line 1510  ip_savecontrol(struct inpcb *inp, struct
Line 1550  ip_savecontrol(struct inpcb *inp, struct
                 struct in_pktinfo ipi;                  struct in_pktinfo ipi;
                 ipi.ipi_addr = ip->ip_dst;                  ipi.ipi_addr = ip->ip_dst;
                 ipi.ipi_ifindex = ifp->if_index;                  ipi.ipi_ifindex = ifp->if_index;
                 *mp = sbcreatecontrol((void *) &ipi,                  *mp = sbcreatecontrol(&ipi,
                     sizeof(ipi), IP_PKTINFO, IPPROTO_IP);                      sizeof(ipi), IP_PKTINFO, IPPROTO_IP);
                 if (*mp)                  if (*mp)
                         mp = &(*mp)->m_next;                          mp = &(*mp)->m_next;
Line 1524  ip_savecontrol(struct inpcb *inp, struct
Line 1564  ip_savecontrol(struct inpcb *inp, struct
                 if (*mp)                  if (*mp)
                         mp = &(*mp)->m_next;                          mp = &(*mp)->m_next;
         }          }
         if (inpflags & INP_RECVTTL) {  
                 *mp = sbcreatecontrol((void *) &ip->ip_ttl,  
                     sizeof(uint8_t), IP_RECVTTL, IPPROTO_IP);  
                 if (*mp)  
                         mp = &(*mp)->m_next;  
         }  
         m_put_rcvif_psref(ifp, &psref);          m_put_rcvif_psref(ifp, &psref);
 }  }
   
Line 1569  sysctl_net_inet_ip_pmtudto(SYSCTLFN_ARGS
Line 1603  sysctl_net_inet_ip_pmtudto(SYSCTLFN_ARGS
         int error, tmp;          int error, tmp;
         struct sysctlnode node;          struct sysctlnode node;
   
           icmp_mtudisc_lock();
   
         node = *rnode;          node = *rnode;
         tmp = ip_mtudisc_timeout;          tmp = ip_mtudisc_timeout;
         node.sysctl_data = &tmp;          node.sysctl_data = &tmp;
         error = sysctl_lookup(SYSCTLFN_CALL(&node));          error = sysctl_lookup(SYSCTLFN_CALL(&node));
         if (error || newp == NULL)          if (error || newp == NULL)
                 return (error);                  goto out;
         if (tmp < 0)          if (tmp < 0) {
                 return (EINVAL);                  error = EINVAL;
                   goto out;
         mutex_enter(softnet_lock);          }
   
         ip_mtudisc_timeout = tmp;          ip_mtudisc_timeout = tmp;
         rt_timer_queue_change(ip_mtudisc_timeout_q, ip_mtudisc_timeout);          rt_timer_queue_change(ip_mtudisc_timeout_q, ip_mtudisc_timeout);
           error = 0;
         mutex_exit(softnet_lock);  out:
           icmp_mtudisc_unlock();
         return (0);          return error;
 }  }
   
 static int  static int

Legend:
Removed from v.1.337.2.1  
changed lines
  Added in v.1.360

CVSweb <webmaster@jp.NetBSD.org>