先明确目标:低延迟、高可用、稳定到内地/全球访问。准备:供应商控制台账号、香港云实例、公网带宽或专线(Direct Connect)、登录SSH权限、测试机(国内或境外)。推荐安装工具:iperf3、mtr、traceroute、curl。
优先选支持BGP、多线或CN2/Carrier级链路的实例。若需稳定到内地,购买“云专线/直连(Dedicated Line / Direct Connect)”或“跨境带宽”产品。查看供应商路由策略(Anycast、Global Accelerator、CDN)并选择支持骨干互联的套餐。
步骤:1) 在控制台申请Direct Connect或云专线工单;2) 填写对端信息(机房、带宽、VLAN);3) 完成接入带宽与物理链路;4) 在控制台配置VPC/交换机并绑定实例私网;5) 配置BGP会话(填写对端ASN、BGP密码、IP段)。供应商通常提供模板和陪测。
在云控制台创建VPC和子网,确保路由表指向Direct Connect网关。示例:新增路由0.0.0.0/0 -> dg-xxxx(DirectGateway)。若使用Linux做路由器,配置ip route add、ip rule和iptables做SNAT/MASQUERADE。
编辑/etc/sysctl.conf,加入并生效:net.core.default_qdisc=fq,net.ipv4.tcp_congestion_control=bbr,net.core.rmem_max=67108864,net.core.wmem_max=67108864,net.ipv4.tcp_tw_reuse=1,然后sysctl -p。开启BBR:modprobe tcp_bbr并写入模块自动加载。
查看网卡:ip link show;如直连支持jumbo frame可设置MTU 9000:ip link set dev eth0 mtu 9000。用ethtool调整offloading:ethtool -K eth0 gro off gso off tso off(视情况关闭或开启以优化小包延迟)。
启用HTTP/2、TLS 1.3、Keep-Alive与Gzip。若使用Nginx,配置worker_processes auto,worker_connections 10240,tcp_nopush on,sendfile on。使用CDN或Global Accelerator把静态内容分发到边缘,减少跨境回源。
若支持多出口,配置多BGP会话并设置Local Preference/AS_PATH策略做流量引导。测试不同路径:使用traceroute -n 与mtr -rw,查看丢包和延迟。若供应商提供“智能路由”,启用并监控路由切换日志。
部署工具:apt/yum install iperf3 mtr traceroute -y。测试带宽:在香港服务器运行iperf3 -s,在测试端运行iperf3 -c
检查点:1) 是不是用了错误的路由表或SNAT规则?2) MTU冲突导致分片?3) 是否为国内访问被运营商限速?4) 是否启用了DDOS防护并误拦流量?按日志、tcpdump -i eth0 port 80 / 443 查看包流向。
用Ansible/Cloud-init模板统一下发sysctl、iptables、监控agent与日志。结合Prometheus+Grafana监控网络延迟、丢包、带宽利用率,设置告警阈值便于快速切换回备线路或伸缩实例。
跨境通信可能涉及备案与合规(例如国内访问要符合ICP等要求),购买前与供应商确认是否需要备案或是否提供合规文档,避免服务被限制或中断。
问:我已开通直连,怎样判断流量确实走到了骨干链路?
答:用mtr/traceroute、BGP Looking Glass和iperf3做验证。mtr能显示路径跳数与丢包点;traceroute能看到经过的运营商边界;向目标跑iperf3测试带宽并与未直连时数据对比;同时在云控制台查看Direct Connect流量监控和BGP邻居状态。
问:开启TCP BBR后会有什么收益和潜在问题?
答:BBR能改善高带宽-高延迟链路的吞吐与稳定性,尤其跨境链路更明显。但在极少数旧交换设备上可能出现兼容性问题,监控CPU与丢包情况,若发现异常可回退至cubic;上线前在流量高峰期做灰度测试。
问:预算有限但需要稳定,建议怎么做?
答:优先选支持多线BGP的香港云与带宽共享方案,使用供应商的Global Accelerator或Anycast IP把流量就近接入;结合CDN分发静态资源,并做系统与TCP层的优化(BBR、MTU、tcp_keepalive),同时监控并按需购买短时直连带宽。