<3c/li>
如何进行服务器流量基准
有许多工具和服务可以用于进行服务器流量基准。一些流行的选项包括:
- Apache Bench
- JMeter
- LoadRunner
- Siege
执行服务器流量基准的步骤因所使用的工具或服务而异。但是,一般步骤通常包括:
- 配置基准工具
- 执行基准测试
- 分析结果
- 实施改进
服务器流量基准最佳实践
在进行服务器流量基准时,遵循以下最佳实践很重要:
- 使用代表真实用户行为的测试方案。
- 在不同时间和条件下重复测试,以获得准确的结果。
- 分析结果并关注性能瓶颈。
- 根据需要实施改进,并重新进行基准测试以验证改善。
结论
服务器流量基准对于衡量最佳网站性能至关重要。通过定期进行基准测试并分析结果,网站所有者和管理员可以持续优化其网站的性能,从而改善用户体验并推动业务成功。
tpc是哪个?tpc是哪个?tpc是哪个?tpc是哪个?tpc是哪个?
TPC网络百科上的词条是这样说的:
天的用户在选用平台时面对的是一个缤纷繁杂的世界。
用户希望有一种度量标准,能够量化计算机系统的性能,以此作为选型的依据。
作者曾在美国从事过数年计算机性能评价工作,深深体会到,计算机的性能很难用一两种度量来评价,而且,任何度量都有其优缺点,尤其是当使用者对性能度量了解不深时,很容易被引入一些误区,甚至推演出错误的结论。
本文以TPC基准程序为例,给出一些实际建议,以帮助用户避免进入这些误区。
一、什么是TPC和tpmC?
tpmC值在国内外被广泛用于衡量计算机系统的事务处理能力。
但究竟什么是tpmC值呢?作者曾向一些用户、推销人员乃至某些国外大公司的技术人员问过这个问题,但回答的精确度与tpmC值的流行程度远非相称。
tpmC这一度量也常被误写为TPM或TPMC。
TPC(TransactionProcessingPerformanceCouncil,事务处理性能委员会)是由数10家会员公司创建的非盈利组织,总部设在美国。
该组织对全世界开放,但迄今为止,绝大多数会员都是美、日、西欧的大公司。
TPC的成员主要是计算机软硬件厂家,而非计算机用户,它的功能是制定商务应用基准程序(Benchmark)的标准规范、性能和价格度量,并管理测试结果的发布。
TPC的出版物是开放的,可以通过网络获取(。
TPC不给出基准程序的代码,而只给出基准程序的标准规范(StandardSpecification)。
任何厂家或其它测试者都可以根据规范,最优地构造出自己的系统(测试平台和测试程序)。
为保证测试结果的客观性,被测试者(通常是厂家)必须提交给TPC一套完整的报告(FullDisclosureReport),包括被测系统的详细配置、分类价格和包含五年维护费用在内的总价格。
该报告必须由TPC授权的审核员核实(TPC本身并不做审计)。
现在全球只有几个审核员,全部在美国。
TPC已经推出了四套基准程序,被称为TPC-A、TPC-B、TPC-C和TPC-D。
其中A和B已经过时,不再使用了。
TPC-C是在线事务处理(OLTP)的基准程序,TPC-D是决策支持(DecisionSupport)的基准程序。
TPC即将推TPC-E,作为大型企业(Enterprise)信息服务的基准程序。
TPC-C模拟一个批发商的货物管理环境。
该批发公司有N个仓库,每个仓库供应10个地区,其中每个地区为3000名顾客服务。
在每个仓库中有10个终端,每一个终端用于一个地区。
在运行时,10×N个终端操作员向公司的数据库发出5类请求。
由于一个仓库中不可能存储公司所有的货物,有一些请求必须发往其它仓库,因此,数据库在逻辑上是分布的。
N是一个可变参数,测试者可以随意改变N,以获得最佳测试效果。
TPC-C使用三种性能和价格度量,其中性能由TPC-C吞吐率衡量,单位是tpmC。
tpm是transactionsperminute的简称;C指TPC中的C基准程序。
它的定义是每分钟内系统处理的新订单个数。
要注意的是,在处理新订单的同时,系统还要按表1的要求处理其它4类事务请求。
从表1可以看出,新订单请求不可能超出全部事务请求的45%,因此,当一个系统的性能为1000tpmC时,它每分钟实际处理的请求数是2000多个。
价格是指系统的总价格,单位是美元,而价格性能比则定义为总价格÷性能,单位是$/tpmC。
二、如何衡量计算机系统的性能和价格
在系统选型时,我们一定不要忘记我们是为特定用户环境中的特定应用选择系统。
切忌为了“与国际接轨”而盲目套用“国际通用”的东西。
在性能评价领域,越是通用的度量常常越是不准确的。
据我所知,美国的一些大用户从不相信任何“国际通用”的度量,而是花相当精力,比如预算的5%,使用自己的应用来测试系统,决定选型。
在使用任何一种性能和价格度量时,一定要弄明白该度量的定义,以及它是在什么系统配置和运行环境下得到的,如何解释它的意义等。
下面我们由好到差讨论三种方式。
1、在真实环境中运行实际应用
最理想的方式是搞一个试点,要求制造商或系统集成商配合将系统(含平台、软件和操作流程)在一个实际用户点真正试运行一段时间。
这样,用户不仅能看到实际性能,也能观察到系统是否稳定可靠、使用是否方便、服务是否周到、配置是否足够、全部价格是否合理。
如果一个部门需要购买一批同类的系统,这种方式应列为首选,因为它不仅最精确、稳妥,也常常最有效率,用户还可先租一套系统作为试点。
用这种方式得到的度量值常常具有很明确和实际的含义。
2、使用用户定义的基准程序
如果由于某种原因第一种方式不可行,用户可以定义一组含有自己实际应用环境特征的应用基准程序。
我举两个例子:近年来,由于R/3软件是应用层软件,SAP公司的基准程序获得了越来越多国外企业的认可;中国税务总局最近也开发了自己的基准程序,以帮助税务系统进行计算机选型。
这种方式在中国尤其重要,因为中国的信息系统有其特殊性。
3、使用通用基准程序
如果第1种和第2种方式都不行,则使用如TPC-C之类的通用基准程序,这是不得已的一种近似方法。
因此,tpmC值只能用作参考。
我们应当注意以下几点:
(1)实际应用是否与基准程序相符
绝大多数基准程序都是在美国制订的,而中国的企事业单位与美国的运作方式常常不一样(恐怕也不应该或不可能一样)。
在使用TPC-C时,我们应该清楚地知道:我的应用是否符合批发商模式?事务请求是否与表1近似?对响应时间的要求是否满足表1?如果都不是,则tpmC值的参考价值就不太大了。
(2)TPC度量的解释
TPC基准程序是用来测系统而不是测主机的,厂家肯定要充分优化他们的被测系统。
此处的“系统”包括主机、外设(如硬盘或RAID)、主机端操作系统、数据库软件、客户端计算机及其操作系统、数据库软件和网络连接等。
在很多厂家的TPC测试系统中,主机的价格只是系统总价格的1/4或更小,而硬盘的价格有可能占到总价格的1/3以上,因为TPC-C要求被测系统必须保存180天的事务记录。
如果同样的主机被用到用户的环境中,厂家报的tpmC值就意义不大,因为用户的实际系统与厂家原来用于TPC测试的系统大不一样。
当同样的主机用在不同的系统中时,tpmC值可能有相当大的变化,现在很多用户还没有意识到这一点。
我举一个例子。
假设用户希望购买一批同类系统,每一系统至少需要1GB的内存和50GB的硬盘。
厂家A、B、C各报了三个价格相当的系统,tpmC值分别为3000、2800、2600。
用户是否应该选厂家A的产品呢?答案是:不一定。
厂家用于测试tpmC值的系统与实际提供给用户的系统配置大不一样。
tpmC最低的厂家C提供给用户的系统反而有可能性能最好,不论是以实际系统的tpmC值还是以用户的实际应用性能来衡量。
(3)TPC测试的成本
TPC-C和TPC-D都是很复杂的基准程序,做一个严格的测试是很消耗资源的,厂家当然不会说出他们花费了多少钱和时间。
但据国外知情人士透露,一个厂家做第一个TPC-C测试需要几十万到上百万美元的资金和半年左右的时间投入。
因此,很多TPC的度量值都是估计的。
由于计算机系统换代频繁,如果用户一定要用通过审核的度量值,就必须多等待半年时间,因此而不能用最先进的系统。
中国的厂家通过审核的时间则更长。
综上所述,我们对中国用户(尤其是大用户)在计算机系统的选型方面有如下建议:
最好建立一个真实的试点,因为实际应用环境是检验计算机系统的最好标准。
中国的行业应该建立符合自己实际应用的基准程序和测试标准。
中国税务总局的做法值得提倡。
国家有关部门应该建立独立的测试中心,制定跨行业、符合中国企事业运作模式的性能测试标准。
“国际通用”的度量可以作为参考值,而不应作为必要条件。
尤其是一定要弄清这些流行度量有什么含义,是在什么样的系统环境中测得的,以及基准程序是否符合企业真实的业务流程和运作模式。
作为一家非盈利性机构,事务处理性能委员会(TPC)负责定义诸如TPC-C、TPC-H和TPC-W基准测试之类的事务处理与数据库性能基准测试,并依据这些基准测试项目发布客观性能数据。
TPC基准测试采用极为严格的运行环境,并且必须在独立审计机构监督下进行。
委员会成员包括大多数主要数据库产品厂商以及服务器硬件系统供应商。
相关企业参与TPC基准测试以期在规定运行环境中获得客观性能验证,并通过应用测试过程中所使用的技术开发出更加强健且更具伸缩性的软件产品及硬件设备。
TPC-C是一种旨在衡量联机事务处理(OLTP)系统性能与可伸缩性的行业标准基准测试项目。
这种基准测试项目将对包括查询、更新及队列式小批量事务在内的广泛数据库功能进行测试。
许多IT专业人员将TPC-C视为衡量“真实”OLTP系统性能的有效指示器。
TPC-C基准测试针对一种模拟订单录入与销售环境测量每分钟商业事务(tpmC)吞吐量。
特别值得一提的是,它将专门测量系统在同时执行其它四种事务类型(如支付、订单状态更新、交付及证券级变更)时每分钟所生成的新增订单事务数量。
独立审计机构将负责对基准测试结果进行公证,同时,TPC将出据一份全面彻底的测试报告。
这份测试报告可以从TPCWeb站点(上获得。
tpmC定义:TPC-C的吞吐量,按有效TPC-C配置期间每分钟处理的平均交易次数测量,至少要运行12分钟。
1.TPC-C规范概要
TPC-C是专门针对联机交易处理系统(OLTP系统)的,一般情况下我们也把这类系统称为业务处理系统。
TPC-C测试规范中模拟了一个比较复杂并具有代表意义的OLTP应用环境:假设有一个大型商品批发商,它拥有若干个分布在不同区域的商品库;每个仓库负责为10个销售点供货;每个销售点为3000个客户提供服务;每个客户平均一个订单有10项产品;所有订单中约1%的产品在其直接所属的仓库中没有存货,需要由其他区域的仓库来供货。
该系统需要处理的交易为以下几种:
New-Order:客户输入一笔新的订货交易;
Payment:更新客户账户余额以反映其支付状况;
Delivery:发货(模拟批处理交易);
Order-Status:查询客户最近交易的状态;
Stock-Level:查询仓库库存状况,以便能够及时补货。
对于前四种类型的交易,要求响应时间在5秒以内;对于库存状况查询交易,要求响应时间在20秒以内。
2.评测指标
TPC-C测试规范经过两年的研制,于1992年7月发布。
几乎所有在OLTP市场提供软硬件平台的厂商都发布了相应的TPC-C测试结果,随着计算机技术的不断发展,这些测试结果也在不断刷新。
TPC-C的测试结果主要有两个指标:
●流量指标(Throughput,简称tpmC)
按照TPC的定义,流量指标描述了系统在执行Payment、Order-status、Delivery、Stock-Level这四种交易的同时,每分钟可以处理多少个New-Order交易。
所有交易的响应时间必须满足TPC-C测试规范的要求。
流量指标值越大越好!
●性价比(Price/Performance,简称Price/tpmC)
即测试系统价格(指在美国的报价)与流量指标的比值。
性价比越小越好!
3.结果发布
各厂商的TPC-C测试结果都按TPC组织规定的两种形式发布:测试结果概要(ExecutiveSummary)和详细测试报告(FullDisclosureReport)。
测试结果概要中描述了主要的测试指标、测试环境示意图以及完整的系统配置与报价,而详细测试报告中除了包含上述内容外,还详细说明了整个测试环境的设置与测试过程。
P690tpmC测试值:76,389,839.00
$/tpmC:831.00
美国美金报价:6,349,223.0
CPU数:32
数据库:IBMDB2UDB8.1
操作系统:AIX5LV5.2
中间件:TUXEDO8.0
P690TPC-C测试的配置:
1.后台:1xeServerpSeries690with32x1.7GHzPOWER4+processorswith128MBL3cacheperMCM(totaloffourMCMs),512GBmemory
2.前端:30xeServerpSeries630Model6E4eachwith4x1.0GHzPOWER4CPUswith32MBL3cache,16GBmemory
SPECweb96:在SPECweb96基准测试程序上实现的每秒钟超文本传输协议(HTTP)操作最多次数,响应时间无明显退化。
SPECweb99:接入数,网络服务器可用预先确定的工作量支持的同时接入数。
SPECweb99检测设备模拟客户通过慢Internet联接,向网络服务器发送HTTP工作量请求。
SPECweb99测试Web服务器运行状况
SPECweb99是由标准性能评估组织(SPEC)开发的Web服务器基准测试。
它测量满足特定吞吐量和客户请求响应速率要求的WEB服务器的最大并发连接数量。
并发连接的合计波特率在320Kbps到400Kbps范围内,则满足相应规范。
SPECweb99在一台称为主客户端的机器上运行,这台机器上包含有允许用户加载特定负载请求的配置文件。
主客户端也要处理在客户端和服务器或测试中的系统(SUT)之间的传输协调问题。
客户端通过许多子进程/线程生成独立HTTP请求流,仿真足够的负载发送给SUT。
在这个测试中,客户端向测试中的服务器发送请求数据。
测试规范要求客户端和服务器之间的连接不能使用片段大小大于1460比特的TCP协议。
因此,每一个客户端读取1460比特或更少数据块的响应。
测试中使用两种类型的负载量:
静态负载.静态负载具有四种类型的文件。
最小的文件的增幅为0.1KB,第二种文件类型的增幅为1KB,最后两种类型的文件的增幅为10KB和100KB。
每一个目录包含每种类型9个文件共36个文件。
目标请求的文件类型在各类型中分散使用。
在每一类中的9个文件中又进行二次分布。
最终目标文件混合为:
35%的请求文件小于1KB
50%的请求文件小于10KB
14%的请求文件小于100KB,但是大于或等于10KB
1%的请求文件小于1000KB,但是大于或等于100KB
动态负载.动态负载是基于广告和用户注册。
共有四种在SPECweb99中使用的请求内容类型,分别是标准动态取操作、动态随机取操作、动态发送操作和客户图形接口动态取操作。
标准动态取操作和客户图形接口动态取操作表现web服务器的简单广告轮转特性。
带有广告轮转的动态取操作追踪用户和用户选择,所以广告可以由不同的方式来定制。
最终,动态发布实施一个用户注册在相应的网站上。
P690SPECweb99测试值:21,000
Web服务器:Zeus4.0
操作系统:AIX5LV5.1(64-bit)
CPU数:16
测试配置:16×1.3GHzPOWER-4Processorsw/1440KBunifiedonchipL2cache,192GBmemory,32x32IBMGigabitEthernet-SXPCIcontrollers,32xGigabitEthernetnetwork(1Gigabit/sec),96xClients(4x375MHzPOWER3-II,RS/P-270),RequestedConnections=,MaxFilesetSize=.6MB
P650SPECweb99测试值:12,400
Web服务器:Zeus4.1r3
操作系统:AIX5LV5.2(64-bit)
CPU数:8
测试配置:8×1.45GHzPOWER4+processorsw/1.5MB(I+D)unifiedonchipL2cache,32MBunifiedoffchip/SCML3cache,64GBmemory,8xGigabitEthernet-SXPCI-Xcontrollers,8xGigabitEthernetnetwork(1Gigabit/sec),48xClients(6x668MHzRS64-IV,pSeries620Model6F1),RequestedConnections=,MaxFilesetSize=.28MB
p630SPECweb99测试值:6,895
Web服务器:Zeus4.2r1
操作系统:AIX5LV5.2(64-bit)
CPU数:4
测试配置:4x1450MHzPOWER4+Processorsw/1536KB(I+D)unifiedonchipL2cache,8MBunified(offchip)/SCML3cache,32GBmemory,4xGigabitEthernet-SXPCI-Xcontrollers,4xGigabitEthernetnetworks(1Gigabit/sec),24xClients(4x375MHzPOWER3-II,pSeries640ModelB80),RequestedConnections=6900,MaxFilesetSize=.12MB
NotesBench:
NotesBench是测试各种不同LotusNotes方面的驱动程序。
目的是执行自定义工作量教本中的命令,模拟客户机的操作。
NotesBench测试“仅测试邮件”和“测试邮件和数据库”。
所有已经公布的IBM结果均为“仅测试邮件工作量”。
p680NotesBench测试值:150,197
用户数:108,000
平均反应时间:0.584秒
Domino服务器版本:5.06a
操作系统:AIX4.3.3
CPU数:4
测试配置:IBMeServerpSeries680(24*RS64IV/600MHz;96GBRAM,30Partitions)
服务器地址在哪里看(网址查询服务器地址)
服务器地址在哪里看,网址查询服务器地址。
小编来告诉你更多相关信息。
在 Linux 系统下即时监控服务器的网络带宽使用情况,有很多工具,比如 iptraf、nethogs 等等,但是推荐使用小巧但功能很强大的 iftop 工具。
iftop 是 Linux 系统一个免费的网卡实时流量监控工具,类似于 top 命令。
iftop 可以监控指定网卡的实时流量、端口连接信息、反向解析 IP 等,还可以精确显示本机网络流量及网络内各主机和本机相互通信的流量集合,非常适合于监控代理服务器或路由器的网络流量。
同时,iftop 对检测流量异常的主机非常有效,通过 iftop 的输出可以迅速定位主机流量异常的根源,这对于网络故障排查、网络安全检测是十分有用的。
缺点就是无报表功能,且必须以 root 身份才能运行。
使用iftop查看服务器网速1. 工具安装仓库地址:软件管理工具安装$ sudo yum install iftop$ sudo apt install iftop 源代码编译安装$ sudo um install libpcap libpcap-devel ncurses ncurses-devel flex byacc$ tar zxvf $ cd iftop-0.17$ ./configure$ makemake install2. 工具使用主要介绍工具的主要参数选项iftop: display bandwidth usage on an interface by hostSynopsis: iftop -h | [-npblNBP] [-i interface] [-f filter code] [-F net/mask] [-G net6/mask6] -h显示帮助信息 -n将输出的主机信息都通过IP显示,不进行DNS反向解析 -N只显示连接端口号,不显示端口对应的服务名称 -p以混杂模式运行iftop,此时iftop可以作为网络嗅探器使用 -b不显示流量的图形条 -B将输出以bytes为单位显示网卡流量,默认是bits显示 -i interface指定需要监测的网卡 -f filter code使用过滤代码来选择计数的数据包(默认是none,但是只计算IP包) -F net/mask 显示特定网段的网卡进出流量(IPv4) -G net6/mask6 显示特定网段的网卡进出流量(IPv6) -ldisplay and count link-local IPv6 traffic (default: off) -P显示主机以及端口信息,这个参数非常有用 -m limit设置iftop输出界面中最上面的流量刻度最大值,流量刻度分五个大段显示 -c config file指定替代的配置文件 -tuse text interface without ncurses Sorting orders: -o 2sSort by first column (2s traffic average) -o 10s Sort by second column (10s traffic average) [default] -o 40s Sort by third column (40s traffic average) -o sourceSort by source address -o destination Sort by destination address The following options are only available in combination with -t -s numprint one single text output afer num seconds, then quit -L numnumber of lines to print3. 界面操作主要介绍 iftop 工具的界面信息展示说明和交互式操作 [1] 界面信息安装完 iftop 工具后,直接输入 iftop 命令即可显示网卡实时流量信息。
在默认情况下,iftop 显示系统第一块网卡的流量信息,如果要显示指定网卡信息,可通过“-i”参数实现。
执行“iftop -P -i eth0”命令,得到如下图所示的 iftop 的一个典型输出界面。
第一部分iftop 输出中最上面的一行,此行信息是流量刻度,用于显示网卡带宽流量。
第二部分此部分为分割线中间的部分,其中又分别分为左、中、右三列。
左列和中列,记录了哪些 IP 或主机正在和本机的网络进行连接。
其中,中列的“=”代表发送数据,“=”代表接收数据,通过这个指示箭头可以很清晰地知道两个 IP 之间的通信情况。
最右列又分为三小列,这些实时参数分别表示外部 IP 连接到本机 2 秒内、10 秒内和 40 秒内的平均流量值。
另外,这个部分还有一个流量图形条,流量图形条是对流量大小的动态展示,以第一部分中的流量刻度为基准。
通过这个流量图形条可以很方便地看出哪个 IP 的流量最大,进而迅速定位网络中可能出现的流量问题。
第三部分位于 iftop 输出的最下面,可以分为三行,其中,“TX”表示发送数据,“RX”表示接收数据,“TOTAL”表示发送和接收全部流量。
与这三行对应的有三列,其中“cum”列表示从运行 iftop 到目前的发送、接收和总数据流量。
“peak”列表示发送、接收以及总的流量峰值。
“rates”列表示过去 2s、10s、40s 的平均流量值。
使用iftop查看服务器网速 [2] 交互操作在 iftop 的实时监控界面中,还可以对输出结果进行交互式操作,用于对输出信息进行整理和过滤,在上图所示界面中,按键 “h” 即可进入交互选项界面,如下图所示。
iftop 的交互功能和 Linux 下的 top 命令非常类似,交互参数主要分为 4 个部分,分别是一般参数、主机显示参数、端口显示参数和输出排序参数。
相关参数的含义如下表所示。
使用iftop查看服务器网速 参数含义P通过此键可切换暂停/继续显示h通过此键可在交互参数界面/状态输出界面之间来回切换b通过此键可切换是否显示平均流量图形条B通过此键可切换显示2秒、10秒、40秒内的平均流量T通过此键可切换是否显示每个连接的总流量j/k按j键或k键可以向上或向下滚动屏幕显示当前的连接信息l通过此键可打开iftop输出过滤功能,比如输入要显示的IP,按回车后,屏幕就只显示与这个IP相关的流量信息L通过此键可切换显示流量刻度范围,刻度不同,流量图形条会跟着变化q通过此键可退出iftop流量监控界面n通过此键可使iftop输出结果以IP或主机名的方式显示s通过此键可切换是否显示源主机信息d通过此键可切换是否显示远端目标主机信息t通过此键可切换iftop显示格式,连续按此键可依次显示:以两行显示发送接收流量、以一行显示发送接收流量、只显示发送流量/接收流量N通过此键可切换显示端口号/端口号对应服务名称S通过此键可切换是否显示本地源主机的端口信息D通过此键可切换是否显示远端目标主机的端口信息p通过此键可切换是否显示端口信息1/2/3根据最近 2 秒、10 秒、40 秒的平均网络流量排序通过此键可根据左边的本地主机名或IP地址进行排序通过此键可根据远端目标主机的主机名或IP地址进行排序o通过此键可切换是否固定显示当前的连接4. 使用示例工具的简单使用方式以及对应的含义解释iftop 的强大之处在于它能够实时显示网络的流量状态,监控网卡流量的来源 IP 和目标地址,这对于检测服务器网络故障、流量异常是非常有用的,只需通过一个命令就能把流量异常或网络故障的原因迅速定位,因此对于运维人员来说,iftop 命令是必不可少的一个网络故障排查工具。
bashiftop -i eth1iftop -i wlan0 -f dst port 22iftop -F 192.168.1.0/24iftop -F 192.168.1.0/255.255.255.0 文章作者: Escape
做好一个服务器管理员需要的十二项经验
1、服务器系统管理
总体来说,服务器系统的管理是整个网络管理工作中的重中之重,特别是在小型单位网络中,单位的网络规模比较小,网络设备比较简单,基本上是属于傻瓜式的。
这里的服务器系统包括网络服务器和应用服务器系统两个方面。
服务器系统的管理是整个网络管理工作中最重要的部分,因为它是整个网络的核心所在,无论是网络操作系统本身,还是各种网络服务器和应用服务器。
具体来说,服务器系统管理主要是安装、配置和管理网络操作系统、文件服务器、DNS、WINS、DHCP等网络服务器,以及像Web、FTP、E-mail、RAS、NAT等应用服务器。
服务器系统管理的最终目标,就是要确保服务器各种协议和服务工作正常,确保服务器的各项性能指标正常发挥。
另外,还需要及时地更新服务器系统的版本或补丁程序,这不仅关系到服务器的性能发挥,而且还关系到整个网络系统的安全性,因为现在的操作系统不断有新的安全漏洞被发现,及时安装补丁可以有效地阻止、填补这些安全漏洞。
目前在服务器系统管理方面的重点与难点当然是各种网络操作系统的管理了。
在这其中又包括各种不同版本的主流Windows、Linux和UNIX网络操作系统的管理了。
而每个系统中所包括的具体管理工作又非常多,非常复杂,但这些又是网络管理员所必须掌握的。
至少,在大多数中小型企业中,网络管理员应该掌握主流的Windows和Linux网络操作系统的管理了。
在一些较大企业,或者一些特殊行业(如金融、证券和保险等)中,UNIX、Linux系统又是最普遍采用的,所以UNIX和Linux系统管理对于专业网络管理员来说,又是必须要掌握的。
当然,像其他应用服务器的管理也是非常重要,而且必须掌握。
2、关键设备的维护与管理
这也是整个网络管理中的重点之一,同时也是非常重要的工作,特别是在网络规模比较大,网络设备比较高档的单位网络中。
因为单位网络系统更依赖这些关键设备的正常工作。
计算机网络的关键设备一般包括网络的核心交换机、核心路由器和服务器,它们是网络中的“节点”。
对这些节点的维护和管理,除了需要经验积累外,还可以通过一些专门的网络管理系统来监视其工作状态,以便及时发现问题,及时进行维护和故障排除。
另外,为了提高网络的可用性,对一些关键设备进行冗余配置也是必不可少的。
冗余包括两层含义,一是从端口角度进行,如对关键设备(如服务器、核心交换机)采取冗余链路连接,这样当其中一个端口出现故障时,另一个冗余链路就可以接替故障链路继续保持正常工作状态;另一层含义是对配置双份的设备或部件,如服务器中的电源、风扇、网卡,甚至内存等,核心交换机和路由器也可以配置两个。
在正常工作时,这些冗余设备或部件起到负载均衡的作用,而在某部分出现故障时,则又起备份的作用。
在关键设备维护与管理中,服务器和网络总体性能的监控与管理是个技术重点和难点。
要用到各种监控和管理工具,如流量监控工具MRTG、网络性能和通信监控的Sniffer类工具,带宽性能监控的Qcheck和IxChariot工具等。
服务器性能方面的监控与管理还可利用操作系统自带的性能和监控管理工具进行。
当然,网络设备的配置与管理是整个关键设备维护与管理的重点与难点,这一点几乎是所有从事网络管理,甚至网络工程技术人员的共识。
目前在关键设备方面,主要是以Cisco、华为3COM等品牌为主,掌握这两个主要品牌设备的配置与管理方法是网络管理员所必需的。
3、用户管理
用户管理是网络管理中的一个重点和难点,所涉及到的方面非常多,如用户账户、密码、文件和网络访问权限、用户权利、用户配置文件及用户安全策略等。
既要保证各用户的正常工作不受影响,同时又要避免分配过高权限而给网络安全和管理带来不必要的安全隐患。
在网络管理中,网络管理员要求在保证网络安全可靠运行的前提条件下,根据单位人员的工作职权和人员变动情况,为每个用户设置账户、密码和分配不同的网络访问权限;设置Web服务器、VPN等远程访问服务器中用户的访问权限等;限制Web服务器可登录的账号数量,及时注销过期用户和已挂断的拨号用户,关闭不用的网络服务等。
但要注意的是,在Linux和UNIX系统中,用户管理不是集中的,因为它们所组建的网络是基于P2P(对等)模式的,除非用其他工具来实现模拟的域管理;而Windows系统的域模式中,可以组建基于C/S(客户机/服务器)模式的域网络,可以进行集中用户管理,这就是Windows域网络的一个重要优势。
而且在UNIX和Linux系统中,用户管理(其他管理也基本上一样)基本上是基于命令符的终端模式进行的,初学者难以掌握,而Windows系统中的管理基本上是以图形界面模式进行的,比较容易掌握。
4、文件系统管理
网络中的文件系统管理是整个网络管理中最重要的部分之一,它不仅涉及到各用户的正常工作和网络应用,同时还关系到整个网络系统的安全性能。
对于网络管理员来说,在文件系统管理中所做的工作主要有以下几个方面首先,要根据企业网络应用的需要选择适当的网络操作系统,部署相应的文件服务器系统、DFS(Distributed File System,分布式文件系统)或者NFS(Network File System,网络文件系统)。
通过这些文件服务器系统的配置,就可以实现许多高级的文件系统管理和应用,如通过文件服务器系统的安装与配置就可时刻监视文件服务器或网络中其他主机上的文件共享与会话连接;通过DFS的部署就可以在全网络中部署统一的共享资源访问点,方便共享资源的使用与管理;通过NFS的部署,就可以实现与其他系统类型网络(如Linux和UNIX系统)的文件相互访问机制。
这些都是与文件系统管理有关的服务器系统,必须熟练掌握。
其次,要为各用户设置必要的文件夹共享权限,以及文件和文件夹的安全访问权限。
当然不同类型文件格式的文件和文件夹所能配置的权限不一样。
在文件格式上,Windows NT平台有FAT(File Allocation Table,文件分配表)和NTFS(New Technology File System,新技术文件系统)文件系统。
NTFS是Windows NT平台所提供的高性能、高可靠性和高安全性的网络文件系统,在新操作系统中尽量采用。
而在Linux系统中目前主要有ext2和ext3文件类型,建议采用最新版本的ext3格式。
最后,需要定期检查服务器文件系统的安全性,最好在组策略中设置文件权限更改方面的审核策略,以便及时发现文件系统权限的非法更改,并予以纠正。
5、磁盘和数据管理
磁盘与数据管理同样是整个网络管理工作中非常重要的方面,特别是在大型、外资企业中。
在磁盘管理方面主要包括磁盘系统的基本操作与管理,如磁盘格式化,磁盘的分区、盘符的分配与调整,文件系统转换,基本/动态磁盘类型的转换,RAID(Redundant Array of Inexpensive Disks,独立磁盘冗余阵列)的配置,以及用户磁盘配额的配置与管理等。
数据管理目前在整个网络管理的重要性更加突出了,因为现代企业网络中保存了大量的企业数据,包括日常的办公文档、电子表格、产品资料、产品数据库、财务数据库和营销数据库等。
这些数据在一定程度上可能关系到企业的生存与发展。
为了确保企业数据的安全,除了必须配备强大而又安全的杀病毒软件系统外,RAID是非常必要的,一方面其可以起到加速磁盘读写速率,提高磁盘读写效率的作用,更重要的是其可以起到保护数据安全的作用,因为有些RAID类型具有镜像,或者奇偶校验功能,通过它们就可以对故障磁盘上的数据进行恢复。
另外,在企业网络中,还要防止因电源故障而出现的文件丢失,这时就要用到UPS(Uninterruptible Power Supply,不间断电源供应),还可能需要为关键的服务器配备冗余电源、电源风扇部件。
确保数据安全的最后一道防线就是制定一套行之有效的容灾方案。
在预防灾难的计划中,网络管理员不应将自己的思维局限在普通的问题上,应该考虑得更广泛一些。
设想发生了自然灾害,如地震、火灾等将整个网络全部摧毁,网络管理员该如何恢复,花费多少时间,采取何种步骤进行恢复。
在容灾方案中一定要详细,并通过模拟实验对方案的可行性和有效性进行验证。
在容灾方案中,其中一个重要方面就是数据备份计划,它是关键中的关键。
备份计划应该包括如下信息:备份什么、在哪备份、何时备份、多长时间备份一次、谁负责备份、备份载体应放在哪、多长时间检查一次备份,以及一旦数据丢失应采取哪些措施。
进行可靠的数据备份是网络管理员最重要的工作之一,做好备份计划后就应该认真执行。
作为网络管理员事先要进行灾难恢复计划,过程中要每天坚持数据备份,事后要及时恢复系统,尽可能地避免数据丢失。
如果是大型企业,或者有分支机构的企业,对于一些关键数据(如企业数据库、E-mail和财务等),为了确保网络系统中文件和文件夹的有效性和安全性,还采用了异地远程数据备份和远程数据镜像存储措施,实施异地容灾,这样企业所能承受灾难的能力就远比只在当地进行数据备份强了。
6、IP地址的管理
IP地址管理是计算机网络能够保持高效运行的关键。
如果IP地址管理不当,网络很容易出现IP地址的冲突,导致合法的IP地址用户不能正常享用网络资源,影响网络正常业务的开展。
目前IP地址有两个主要版本,是IPv4和IPv6。
现在普遍使用的仍是IPv4,但IPv6协议也正在开始普及,新的操作系统,如Window Vista、Windows Server 2008、RedHat Enterprise Linux AS 4.0和RedHat Enterprise Linux 5.0等都已开始支持IPv6协议了。
在小型计算机网络中目前都是直接采用IPv4 C类地址中的192.168.0.0/16专用网络地址段,每个IP子网可以拥有256台计算机或网络设备。
而在大中型企业中,通常是采用A(10.0.0.0/8专用网络地址段)或B类(172.18.0.0/12专用网络地址段)IP地址。
这些地址均无须申请,可直接使用。
当然在单位网络中,IP地址的分配通常不是严格按照IPv4协议中规定的类别来进行的,而通常是采用地址前缀方式重新划分。
在IPv4协议中,IP地址的分配一般有两种方式。
静态IP地址分配法:对于服务器(包括域控制器及其他所有成员服务器)、经常上网的计算机和网络设备一般给予一个固定的IP地址。
DHCP动态IP地址分配法:对于那些不经常上网或是移动性较强的计算机,可以采用动态主机配置协议(DHCP)来动态配置IP地址,以节约IP地址资源。
这里关键是要设置好地址池范围。
经验之谈
对于小型企业网络(50个用户以内),建议采用DHCP动态IP分配方式(需要采取静态IP地址的终端在DHCP服务器中排除即可),因为这类网络终端用户比较少,完全可以通过其他方式对网络中的各终端进行管理。
而对于较大的企业网络,则建议采取静态IP地址分配方式,因为如果这类网络采取动态分配方式,则当网络出现故障时,就很难查找故障的发生点。
而对于大的企业网络,如果用一个C类IP地址不够用,而且有些部门长期只有少数用户需要上网(主要是营销部门),此时建议采取划分子网的方法,对一些基本有固定上网用户的部门采取静态IP地址分配,而对那些长期只有少数用户上网的部门采取动态IP分配方式,可以节省大量的IP地址。
7、安全管理
在网络安全管理上,现在的企业比几年前要求高了许多。
不仅要求网络管理员能部署防火墙、杀毒软件系统,而且还要能对整个网络部署一套有效的安全策略,全面保证网络的安全。
安全管理员根据实际经验得出,最重要的部分在于用户权利的配置、文件和文件夹共享权限和安全访问权限的配置。
可使用的管理方法有系统管理报警选项设置、事件日志分析和安全策略审核等。
良好的安全策略对于企业的数据、软件和硬件是绝对重要的。
在网络安全行业内流行着这样一条80/20法则,也就是80%的安全威胁来自网络内部(内部危害分为三类:操作失误、存心捣乱及用户无知)。
要想保证网络的安全,在做好边界防护的同时,也要做好内部网络的管理。
网络管理的职责之一就是定义、实施、管理和加强网络的安全性。
如果许多无关的人也可以登录服务器,非授权的人也可以窃取或破坏信息,那么即使最好的硬件、软件和培训也都变得毫无价值。
软件安全策略的目标是保证只有授权的用户才可以使用一定受限的网络资源,预防给予过高的权限,定时检查用户权限和用户组账户有无变更。
减小数据、服务器和网络设备等由于受到疏忽的操作或恶意的破坏而造成的损失。
对于服务器而言,错误操作是最大隐患。
这要求网络管理员自身要加强这方面的学习,对于用户,网络管理员要加强这方面的意识和操作培训。
防止网络中非授权的外部访问。
例如,通过Internet访问。
这是个易被忽视的内容,但对于网络管理员这是无法原谅的粗心。
要限制用户的非法外网访问,一方面可以通过用户授权,另一方面还可以通过一些专用网络管理软件或硬件来实现,如一些代理服务器和宽带路由器就有访问控制的功能,要好好利用。
此外还需要注意的是对用户的管理。
当单位来了新的员工时,网络管理员需要为他(她)创建新的用户账号;当有职工调动工作岗位时,网络管理员该为其重新分配用户权限;当有职工离去时,网络管理员应该立刻删除这个账号与密码。
另外,在安全管理方面,还要注意安全管理中的“木桶理论”,整个网络的安全管理都是相互关联和影响的,整个网络的安全性最终取决于安全性能最差的部分,而不是那些安全管理做得最好的方面。
8、软件管理
软件管理包括添加新的软件、升级现有的软件和删除过时的软件。
如果在服务器上安装,最好在安装之前做好服务器备份。
如果在工作站上安装,应该先做一个安装测试,然后保证每一台工作站的一致性。
如果要在工作站上安装新软件,应该先做一个安装测试,并记录下每一个步骤。
测试安装在典型的工作站上是否会出现问题。
如果认为满意,就在每一个用户的计算机上都重复安装过程,保证一致性。
如果在每一台工作站上都使用相同的硬件和操作系统,一致性的安装应用程序非常简单。
如果网络上用户过多,可以考虑使用某些特殊的工具来生成软件自动安装过程。
如Windows系统的“无人值守安装”和“远程安装”功能就可大大减轻网络管理员软件安装的负担。
软件永远不可能完美,总会有这样或那样的问题,所以无论是操作系统还是设备的驱动程序,都应该至少每个季度检查一次有无升级的提示,在服务器和工作站上都要进行这一项工作。
有时,补丁程序本身比要解决的问题更加可怕,操作系统的补丁导致的严重事故比比皆是。
如2003年1月25日爆发的Slammer病毒就是利用了SQL Server 2000的一个漏洞进行攻击的蠕虫病毒。
其实早在2002年7月,微软就针对SQL Server 2000中1434端口的漏洞,公布了安全补丁程序,对于微软服务器软件的用户来说,只要下载了补丁程序,就可以避免这次灾难。
但遗憾的是,太多用户忽视了微软的建议。
从上面的例子不难看出,安全意识的树立,在某种意义上比安全技术本身更重要。
另外,在软件管理方面还应对服务器中专门存放源程序文件夹的访问权限进行严格限制,通常只允许系统管理员有权限访问和使用,否则一些不自觉的用户会在他们的计算机上安装一些本来他们不需要的软件。
9、硬件资源的维护与管理
在企业网络中,网络管理员通常需要负担起管理服务器和全部共享网络资源的责任,包括打印机、处理器、内存和硬盘等。
在这种条件下,网络管理员的责任是相当直接的。
在对这些网络硬件资源的管理中,其中一项重要任务就是实施常规检查。
虽然现在复杂的网络操作系统可以承受一定程度的问题而不至于停工,但是网络管理员在这些非关键性的错误堆积起来并变得严重之前,需要周期性地检测服务器并纠正这些错误。
计算机系统也带有诊断工具,但是可能需要使用比它们更复杂的专业工具,比方说Intel公司的LANDesk Management Suite或者Novell的ManageWise,可以进行更细致的测试,并有更好的联机帮助。
网络就是网络管理员的阵地,网络管理员还应对网络内的各台微机或各个工作站进行定期巡检,了解每台计算机的状态,并定期保养。
在出现了硬件故障后,网络管理员还必须承担起故障排除和基本硬件维修的责任。
这是最体现网络管理员的技术水平、冷静心态和逻辑思考能力的时候。
随着经验的增长,解决问题的能力也会逐步提高。
网络管理员要了解各处可能发生的问题:时刻不忘在笔记本电脑中记下调查结果和建议;利用书籍、期刊和自学培训等方式尽可能地积累常见问题的解决方法;当然还应该采取措施预防网络故障的发生。
网络管理员应尽可能多地搜集信息,并记录在网络文档中。
你会惊奇地发现以前的积累常常可以帮助查明某个事件的原因。
10、网络打印机的配置和管理
在企业中,打印机是必不可少的,特别是现在网络打印机得到广泛应用的今天。
之所以要单独把它列出来,是因为其在企业网络中的位置已越来越重要,特别是在一些商务型企业中。
如何有效地管理企业网络中的打印机和打印任务,也是网络管理员所必须面对的。
这就要求网络管理员不仅要懂得如何安装、设置共享打印和网络打印服务器,而且还要熟悉一些网络打印机管理软件的使用,设置网络打印机的策略、共享属性和安全规则。
11、网络布线的日常维护
网络故障在相当大程度上是来自布线系统,有经验的网络管理员都会知道,布线系统看似简单,其实其中蕴涵着丰富的经验与技巧。
做好了,在出现故障时,就能及时快速地定位故障的发生点;做不好,可能花费几天的工夫也不一定能找到其实很明显的故障原因。
在日常的网络管理工作中,需要根据员工的调动与工作需要在网络上添加新的服务器、工作站和联网设备,替换被损坏的线缆或排除网络线缆接头故障等,都需要对网络布线系统进行维护。
1)建立网络布线基准文件
在线缆系统安装后,网络管理员使用电缆测试仪对线缆进行周期性检测,确保布线系统的质量。
在评估认证后,将电缆测试仪存储的测试结果复制到计算机上并打印出来,作为网络布线基准文件。
对于不合格或者即将不合格的线缆、模块或水晶头等附件进行即时更换。
2)网络布线故障的测试与定位
将网络布线系统分割为若干个逻辑元素,每个逻辑元素包含一段固定链路、分线盒和跳接电缆。
使用电缆测试仪逐个测试逻辑元素,若电缆测试仪显示开路的距离,可以确定开路或短路的位置;若发现接线映射故障,多数是固定连路两端的误接;若是衰减存在,多数是劣质电缆。
使用替代法验证可疑元件即可。
12、网络升级与改造
随着网络技术的不断发展和网络应用领域的不断拓展,无论哪个企业的网络随着时间的推移,都将面临升级或改造。
如在无线WLAN技术还没有得到广泛应用的2003年之前,企业网络基本上都是清一色的有线以太网,而从2003年3月Intel推出了集成无线网卡的迅驰处理器以后,WLAN无线网络技术得到了迅速发展,新技术、新标准不断涌现,WLAN技术已从小范围实验走向了企业应用的前沿。
现在就有许多企业在原有有线网络中部署了WLAN无线网络,如会议室、大堂、学校的操场和图书馆等公共场所。
目前最新标准的IEEE.11n方案(还没正式批准)已开始上市,传输性能达到了前所未有的300Mbps或更高,比现在主流的54Mbps IEEE 802.11g足足高出了5倍多。
还有,虽然现在绝大多数中小企业网络都只是百兆位,但实际上千兆位以太网早在几年前就开始普及了,原来的百兆位主干、十兆位桌面变成了千兆位主干、百兆位桌面,甚至是万兆位主干、千兆位桌面。
还有如网络电话、VPN网络应用等,这些都是以前所没有得到实质应用的,而现在却在许多企业中广泛应用。
这些都属于网络升级或改造的范围,作为网络管理员,必须掌握最新的网络升级、改造技术,能根据企业自身需要提出各种可行的升级、改造方案。