Monthly Archive十月 2008



未分类 17 Oct 2008 10:56 am

[转][笑话] 为什么水木社区坏了一个礼拜都没有修好?

发信人: Linxs (没有宽恕就没有未来), 信区: NewExpress
标  题: Re: 比较怀疑水木挂站是非技术原因
发信站: 水木社区(临时站) (Fri Apr  4 00:32:08 2008, 站内

事实是这样的

一天上帝在机房吃煎饼油条,结果滴了油在机箱边缘上

本来油是不导电的,应该没事,所以上帝没当回事

那滴油沿着机箱边缘渗到里头,

进入电源盒子,滴在了风扇的轴的端处

本来油滴在轴承上,是件好事情,

但是,上帝滴的那滴是带有食品颗粒的食用油

过了短时间,渐渐发霉,变酸,变粘

唐山的机房通风很好,沙尘也经常进来,慢慢的黏在了轴承上

再有就是静电产生的一些絮状物,也黏在了轴承上

这个现象在我们普通的机箱也是经常见到的

其实,机箱里脏兮兮的,灰尘和赃物也没什么的

但是,偏偏那天上帝吃的太油,滴的不是一滴,而是两滴油在机箱上!

第一滴油进入了电源盒子里,那第二滴油呢?

第二滴沿着近似路线也渗到了机箱里,但是没有落在电影盒子里的风扇轴承上,

是被风扇吹着斜落在到了主板接硬盘上的某个线上,

渐渐的发霉,发酸。。。。

如果上帝只是在机房里吃一次煎饼油条,那么事情也许就不会落到今天的地步。

但是,互联网的墨菲定律,最担心的事情一定会发生。

我们最担心上帝在机房吃煎饼油条,那么上帝一定会在机房吃肩膀油条。

在后来的2次进入机房的机会,上帝又在机房吃煎饼油条,一共3次,

总共落下了大小5片煎饼油条的碎屑。

机房是不养宠物的。

有了上帝留下的这些零食,蚂蚁不知道从哪里钻出来了。

很快蚂蚁就搬光了地上的碎屑,走了。

看起来事情也许到此为止了,但是真正的故事才刚刚开始。。。

落在队伍最后面的那只蚂蚁,因为体弱跟不上大部队,在后面慢慢吞吞的走啊。

造化赋予人一个短处,必然同时赋予人一个长处。对于蚂蚁也是一样的。

这只落在队伍最后面的小蚂蚁,虽然体弱,但是嗅觉灵敏。

它闻到了来自机箱上方的发酸的油滴气味,便转上沿着机箱缝隙爬了进去

离它最近的是那滴掉在硬盘线上的油滴, 小蚂蚁奋勇地向这滴上帝之油爬去

历经千辛,走迷宫似的绕过主板上的电路,来到了硬盘线上的酸油面前。

不幸的事情发生了。。。。

这天是2008年1月29日,也就是上证A股指数大跌8%的1月28日的第二天早上9点整

很多受伤的人都在这个时间段打开电脑/电视,准备开始炒股。

民用电量的短时间上升,导致了部分地区电力线的电压的快速下降,

来自水木上某个网友在职公司开发的某个供电系统的自动控制系统开始动作,

往包括唐山机房所在的地区的电网新增加一个供电电源

如果这个自动控制系统做的很精细,新增电源的的瞬间电压骤变控制的好,

灾难就不会发生。

但是,项目管理里有个定律,眼睛看不到的细节最容易出问题。

理所当然的,瞬间电压的骤变发生了。

机房里,运载着水木社区的电源风扇受这个电压骤变影响,微微的抖了一下。

轴承的瞬间加速度的变化,导致了那团围绕在上帝之油上的灰尘与絮状物的结合体

受了震动,本来摇摇欲坠的它,落了下去,掉在电源盒子的底部,

很快被风扇的风吹到一个螺丝孔边,落了下去,进入了机箱的内部空间。

砸到了那只正在用触角品尝硬盘线上的第二滴上帝之酸油的蚂蚁身上,

一下子把蚂蚁砸昏了,蚂蚁和灰尘絮状物结合体接着往下掉,

在经过CPU风扇前,被向内吹的CPU风扇吸引,斜着往主板下下方飞去

最终蚂蚁靠着触角上黏黏的发酸食用油,

黏在了CPU下方北桥芯片上的名为GPIO16的管脚上,

而后脚悬空靠近主板上的一根地线,摇摇晃晃。

这根名为GPIO16的管脚被主板BIOS重定义为低电平RESET 北桥芯片!

最后,机箱里的紊流开始发挥作用!

每隔一段时间,蚂蚁的后脚被微微的紊流一吹便碰到那根地线,直接RESET系统!

如果水木不是用raiseFS,或许就不会有这么严重的问题。

如果raise的老婆不出轨,raise就不会杀妻,就不会受控,raiseFS就会更稳定。

如果raiseFS更稳定,就不会那么容易崩溃导致水木死掉。

但是,这个世界上没有那么多如果。

事实就是raise的老婆出轨,raise杀妻,raiseFS有bug。

在多次无规则随机的重启之后,水木的FS系统终于崩溃了!

这就是水木社区硬盘崩溃的非技术原因!

但是,从中,我们更多的看到,是人,某些人造成了这次灾难!

他们,包括

- 违反规定在机房吃煎饼油条的KCN,

- 大量滥用地沟油的煎饼油条老板,

- 那只贪吃的蚂蚁,

- 造成2008年1月28日上证指数大跌的主力资金操盘手

- 设计电力自动控制系统的某水木网友,

- 水木服务器的系统BIOS设计人员,

- 勾引raise老婆的第三者

- 不贞洁的raise老婆

- 因冲动杀人的raise同学

- 制造紊流的西方上帝

是他们,有意无意的共同参与了2008年4月1日水木社区崩溃灾难的这场阴谋。

Web Server/Apache/Nginx & 技术 14 Oct 2008 01:27 pm

ncache试用

NCACHE 是基于 NGINX 的 WEB 服务器模型构件起来的缓存系统, 是SINA公司的开源产品.

起初的目的是为了提升缓存响应速度而开发的,因为SQUID实在比较慢, 而NGINX的优势就在于网络服务上,所以NCACHE计划也就诞生了.

NCACHE最早的时候是作为NGINX的一个HTTP模块进行开发的,因为当时希望做到更好的兼容性和可扩展性,作为独立模块,可以被更好的推广和使用,安装也会很方便.但后来发现随着代码量的增加,功能的扩充,NGINX的原有模块框架已经不能很好的满足我们了,因此,我们提取了NGINX的内核代码,并把CACHE部分欠入其中,形成了今天的NCACHE

NCACHE本身功能并不强大,且不具备像SQUID般完善的功能和开发框架,甚至不能支持RFC中关于CACHE部分的描述. NCACHE完全是一套定制化的产品,可以满足像我们一样需要快速部署,简单易用,大并发量,大存储量的朋友们的需求,它不需要复杂的配置,不需要冗余的复杂代码,并使用最先进的技术组合.

NCACHE 2.0版本,是作为一个完整的NGINX 模块进行发布和使用的,从原有的NCACHE内核中进行了剥离,更方便开发者的安装和配置

http://code.google.com/p/ncache/

下载后重新编译nginx

配制文件检查无错;
生成cache目录;
nginx在80,使用apache在8080做后台;
产生max-age;

time_count:1583 request_count:29 shoot_count:0 disk_writes:4 store_files:10 upstream_count:2 free_index:16777215

Web Server/Apache/Nginx & 技术 10 Oct 2008 02:02 pm

让nginx的expires和防盗链都有效

expires有效,防盗链失效
location ~* ^.+\.(jpg|jpeg|gif|png|css|js|swf)$ {
access_log off;
root /opt/htdocs/career;
expires 1h;
#break;
}

location ~* ^.+\.(jpg|jpeg|gif|png|swf|rar|zip)$ {
valid_referers none blocked *.c1gstudio.com;
if ($invalid_referer) {
rewrite ^/ http://leech.c1gstudio.com/leech.gif;
return 412;
}
}

只有js和css的expire有效,防盗链有效

location ~* ^.+\.(jpg|jpeg|gif|png|swf|rar|zip)$ {
valid_referers none blocked *.c1gstudio.com;
if ($invalid_referer) {
rewrite ^/ http://leech.c1gstudio.com/leech.gif;
return 412;
}
}
location ~* ^.+\.(jpg|jpeg|gif|png|css|js|swf)$ {
access_log off;
root /opt/htdocs/career;
expires 1h;
#break;
}

让expire和防盗链都有效

location ~* ^.+\.(jpg|jpeg|gif|png|swf|rar|zip|css|js)$ {
valid_referers none blocked *.c1gstudio.com;
if ($invalid_referer) {
rewrite ^/ http://leech.c1gstudio.com/leech.gif;
return 412;
}
access_log off;
root /opt/htdocs/career;
expires 1h;
break;

}

Web Server/Apache/Nginx & 技术 09 Oct 2008 03:12 pm

nginx应用日三百万pv记录

使用nginx架构的php应用负载5以下达到了日pv三百五十万,平均连接数六千多,并且保持了不错的响应速度。
具体安装:
nginx+php(FCGI)+xcache+mysql on as4

以下为awstats一天的详细统计数据

广告系统(简单php+js)

  参观者 参观人次 网页数 文件数 字节
浏览器流量 * 96823
 
130818
(1.35 参观人次/参观者)
713865
(5.45 网页数/参观)
7163660
(54.76 文件数/参观)
763.43 M字节
(5.97 K字节/参观)
非浏览器流量 *  
 
7471 11096 1.01 M字节

sns(一般复杂php+mysql)

  参观者 参观人次 网页数 文件数 字节
浏览器流量 * 30300
 
35773
(1.18 参观人次/参观者)
102488
(2.86 网页数/参观)
339758
(9.49 文件数/参观)
574.38 M字节
(16.44 K字节/参观)
非浏览器流量 *  
 
180110 2558206 2.84 G字节

文章(简单php+mysql)

  参观者 参观人次 网页数 文件数 字节
浏览器流量 * 23168
 
29433
(1.27 参观人次/参观者)
135918
(4.61 网页数/参观)
475899
(16.16 文件数/参观)
1.17 G字节
(41.81 K字节/参观)
非浏览器流量 *  
 
16498 20887 87.61 M字节

discuz6(php+mysql)

  参观者 参观人次 网页数 文件数 字节
浏览器流量 * 81182
 
118632
(1.46 参观人次/参观者)
2568752
(21.65 网页数/参观)
10408084
(87.73 文件数/参观)
26.48 G字节
(234.05 K字节/参观)
非浏览器流量 *  
 
189089 209570 5.89 G字节

一般复杂php+mysql

  参观者 参观人次 网页数 文件数 字节
浏览器流量 * 2908
 
3455
(1.18 参观人次/参观者)
11183
(3.23 网页数/参观)
30527
(8.83 文件数/参观)
52.70 M字节
(15.61 K字节/参观)
非浏览器流量 *  
 
1645 1663 3.24 M字节

商店(简单php+mysql)

  参观者 参观人次 网页数 文件数 字节
浏览器流量 * 2286
 
2612
(1.14 参观人次/参观者)
7829
(2.99 网页数/参观)
78226
(29.94 文件数/参观)
859.63 M字节
(337 K字节/参观)
非浏览器流量 *  
 
437 477 1.38 M字节

软件
os:as4
app:nginx 0.62+php5.26(fcgi)+mysql5.16+xcache+postfix
nginx:4

keepalive_timeout 60

phpcgi:50
mysql:

key_buffer_size = 160M
query_cache_size = 64M
query_cache_limit = 2M #default=1M
query_cache_min_res_unit = 2k #default=4K

max_allowed_packet = 16M
table_cache = 768

tmp_table_size = 128M #default=16M
max_heap_table_size = 128M #default=16M

read_buffer_size = 2M
read_rnd_buffer_size = 8M

sort_buffer_size = 32M
join_buffer_size = 4M
myisam_sort_buffer_size = 64M
thread_cache_size = 80 #default=0
thread_stack = 192K #default=192K

thread_concurrency = 8 #default=10
max_connection = 100
max_connect_errors = 100
wait_timeout = 10

硬件
cpu :2颗双核至强 1.60GHz
mem:1G*2
harddisk:scsi 74G*1

负载
主要应用为discuz ,六十万会员,每日1.5万贴,db大小为三百多兆,其中php的javascript缓存占了大部分。
论坛平均一小时在线五千多人,高峰为七千.

nginx status
Active connections: 6845
server accepts handled requests
 14859839 14859839 56220725
Reading: 12 Writing: 15 Waiting: 6818
高峰时同时连接达八千多

top(高峰时load可达十几)

top - 14:45:37 up 35 days, 21:51,  1 user,  load average: 3.82, 3.78, 
Tasks: 202 total,   1 running, 201 sleeping,   0 stopped,   0 zombie
Cpu(s): 21.6% us,  4.1% sy,  0.0% ni, 70.5% id,  3.7% wa,  0.1% hi,  0
Mem:   2073976k total,  1985372k used,    88604k free,    83884k buffe
Swap:  2040244k total,     4336k used,  2035908k free,  1267284k cache
 

mysql统计

服务器已经运行了 0 天 2 小时,23 分 55 秒
连接   ø 每小时   %
max. concurrent connections  65  ---  ---
尝试失败  46  18.55  0.02%(firefox每次刷新都会加2,不明白)
中止  1,699  685.08  0.83%
统计  206 k  82.97 k  100.00%
2008-10-10
去掉广告系统。

修改expire增加到3天,来降低http连接(参考discuz.net的10天)
日志不记录图片的请求
效果:Active connections降低一半多。负载降低了四分之一左右。
论坛共 7196 人在线 - 最高记录是 110122008-10-12.
Active connections: 3195
server accepts handled requests
 495784 495784 1917665
Reading: 16 Writing: 35 Waiting: 3144
top - 10:55:43 up 39 days, 18:01,  1 user,  load average: 2.89, 3.06, 
Tasks: 174 total,   1 running, 173 sleeping,   0 stopped,   0 zombie
Cpu(s): 23.6% us,  4.2% sy,  0.0% ni, 63.7% id,  8.5% wa,  0.1% hi,  0
Mem:   2073976k total,  1958516k used,   115460k free,   117848k buffe
Swap:  2040244k total,      188k used,  2040056k free,  1313148k cache

LINUX & 技术 08 Oct 2008 12:07 pm

linux swap大小

mem < 2G, swap = 2G
mem > 2G, mem < 8G, swap=mem
mem > 8G, swap=8G

不装oracle时2Gswap就可以了

linux 维护优化 & 技术 07 Oct 2008 03:27 pm

关闭631端口cups打印服务和8009端口ajp

用nmap扫了下服务器发现631端口是打开的。

631/tcp open ipp

//先检查下
#ps aux|grep cups

//关闭服务
#service cups stop

//查看自启动
#chkconfig –list cups
cups            0:关闭  1:关闭  2:启用  3:启用  4:启用  5:启用  6:关闭

//关闭自启动服务
#chkconfig –level 2345 cups off

//再检查下
#chkconfig –list cups
cups            0:关闭  1:关闭  2:关闭  3:关闭  4:关闭  5:关闭  6:关闭

============================我是分割线===================

8009/tcp  open     ajp13

8009端口是tomcat和apache的mod_proxy_ajp,mod_jk沟通的端口,我这里apache纯做代理所以可以关闭。

tomcatpath/conf/server.xml 中的这段注释掉
 <!–
    <Connector port=”8009″ protocol=”AJP/1.3″ redirectPort=”8443″ />
    –>

重启tomcat

收工~

« Previous Page