Featured Posts

纠结与释怀 这几天的纠结让我度日如年,伴随我的是焦虑和失眠。好久没有这样的感觉了。 我总是患得患失,这是一种心理问题,在做选择的时候,反复对比各方的优劣,放不下东,也舍不得西。 自己不知道怎么选择,然后反复问家人和朋友,即使问到答案,也不能让自己安心顺从。 幸运的是,在反复纠结之后,我逐渐想明白了一些道理。 选择,就要付出代价,必定有所得有所失,我应该勇敢承担起责任,坦然面对自己的选择带来的变化和影响。 纠结的时候,我感觉自己是个懦弱的人,害怕犯错,害怕不好的结果。 现在,我鼓起勇气,自己做出选择,不管对错,我接受,不后悔。 我要感谢猛哥,花费很多时间和精力,前后沟通,给我提供了非常难得的机会,在我最终没有选择这个机会的时候,仍然支持我的选择,并告诉我他这里的大门永远向我敞开。 此时,时间像突然停止了一样,飞快打字的手,也一下停住了,我反复看着这句话,感觉到眼眶周围热热的,滑滑的…… 我想我的勇气,多半来自于猛哥对我的关照。 我只求将来有机会能够报答猛哥的知遇之恩。 是时候为自己的选择努力工作了,大家一起加油!

Readmore

CentOS: cannot restore segment prot after reloc 最近在研究CentOS,用xampp装一套集成的LAMP环境,结果在启动Apache的时候报错: cannot restore segment prot after reloc: Permission denied 原因是 modules/mod_perl.so 不能加载。 查了一下可能是SELINUX的问题,有一个解决方法: 用 chcon...

Readmore

PHP 文件下载 IE 无法打开页面 IE 又有一个弱得不行的问题让我发现! 有个项目,要限制文件的下载权限,只有注册用户才可以下载,用户登录后,点击下载链接,弹出保存附件的提示。 我用...

Readmore

Subversion neon 诡异配置 一波三折 今天发现前几天装的 subversion 居然没法通过 http 协议访问版本库! Subversion 出现 svn: Unrecognized URL scheme for 'http://.....'  这样的错误提示。 检查 svn 客户端是否支持...

Readmore

  • Prev
  • Next

文件备份 在线备份 在线备份你的电脑

Posted on : 22-01-2009 | By : leakon | In : Web2.0

0

备份这个话题,我有很多想说的。

我个人对数据安全非常敏感。刻盘通常都刻 2 份,自己数码相机拍的照片每隔 1 个月就要做一次全部备份。

我有个朋友,因为硬盘坏了,里面存放的所有的照片都找不回来了,不知道该用什么词来形容。

前几天我的博客打不开了,帐户被临时关闭。原因是我在服务器上存了 300 多 G 的文件备份。这个空间的特点就是不限存储容量,但使用协议上写了不允许用作文件备份。我当时没仔细看,今天就被惩罚了。

我跟那边的客服沟通后立即删除了这些备份,过了一会儿就恢复了。

我估计是因为备份文件占的空间太大,达到了警戒值,他们自动检测的程序发现了。我存了半年多的备份,时间是有些长。现在我计划只保存一个月的,应该在 100G 以内,不会再被他们发现。

后来我还看了看 Amazon Simple Storage Service (Amazon S3),这个是专门用来存储文件的付费服务,有点贵,暂不考虑。

有个问题是,服务器的文件好备份,自己电脑上的文档什么的,同步起来比较麻烦,尤其是当文件有变化时,没法做双向自动同步。

有没有简单而便宜的备份方式呢?答案是肯定的!

backblaze

Backblaze 给个人电脑提供了在线备份服务。首先你需要下载一个 1.5M 的客户端并安装。Backblaze 自动通告所有新的和修改过的文件,自动地开始备份工作。数据的安全和隐私是非常重要的。

档案通过一个加密的 SSL 连接,直接向 backblaze 数据中心发送并储存。无论你的电脑在哪里:在家庭,工作场所,在网吧,或其他地方,只要你有一个Internet连接。

 

无论您身在何处,都可以通过网络浏览器方便地浏览恢复你的文件!找到一个Internet连接,登录到你的账户,得到任何档案,只要你想。任何时间,任何地点,完全免费。

如果有数以千计的照片,大量的音乐,和一大堆其它文件,不方便通过互联网取回,你可以使用联邦快递,也可以使用 DVD 碟片或一部新的外接 USB 硬盘承载你的整个档案。

Backblaze 好是好,唯一不足的,是 Backblaze 只提供了 15 天的试用。以后每月要支付5美元才能继续使用。

点击进入:Backblaze

他们的首页有个很夸张的视频,很有说服力。

不限容量,一个月 5 美元,我感觉还是负担的起,算起来一个月 30 块人民币左右。

少打一次车,可以避免珍贵数据丢失,感觉挺值的。

写给 WEB2.0 站长 不仅仅是泼冷水

Posted on : 22-10-2007 | By : leakon | In : Web2.0, 互联网, 转载

0

当互联网吵吵嚷嚷的进入2.0时代,当互联网的技术不再是那么高不可攀,当复制变成家常便饭,互联网热闹起来了

    myspace火了,中国冒出更多的myspace

    youtube刚刚起来,中国的视频网站就遍地开花

    51拔地而起,中国出了无数的SNS

    facebook则改变了中国站长的抄袭方式,不再学chianren了,校内火了
..........

    当抄袭变成习惯,我想说的是,模仿,站长,你准备好了吗?

    如果你打算做垃圾站,或者赚点广告费的网站,请不要点击这篇文章,我从技术角度方面谈谈WEB2.0网站的模仿问题。

    当投资和流量都不是问题的时候,我想说的是,您真的一帆风顺吗?

    拿SNS网站来说,当匆匆上线的2.0,当一笔笔投资砸进去的时候,当流量上去的时候,您的困惑在什么地方?

    我做过多个2.0公司的技术顾问,简单的谈谈2.0公司遇到的问题(涉及隐私,我用A B C D代替),这里就不再赘述大家众所周知的页面静态化,缓存和代码安全等问题了,有点技术的2.0公司的CTO都知道这些东西,我们谈点发展之后的问题

A公司

    A公司做的是SNS网站,程序是两个毛头小伙子做的,目标直指51,程序开发是一帆风顺,功能也比51牛多了,推广也是一帆风顺(A公司有自己独到的推广 方式。但是当ALEXA到2W的时候问题出来了,每天下午4点左右,网站速度慢的惊人,基本上打不开,公司三台服务器CPU100%,让人郁闷的是公司的 网络配置方式,居然是双WEB的集群,而单独一台DB数据库。整个瓶颈在数据库,于是我建议做DB的集群,分析了一下数据结构,MD,典型的WEB程序员 的作品,没有一点数据库设计规范,功能实现是可以,如果要扩展,不可能,集群基本上是不可能的,怎么办?不能办,于是,一个月的时间修改程序,数据结构基 本上换了一遍 前期砸进去的几十万打了水飘,用户走光了。

    结论:WEB2.0前期设计的时候不应该只考虑功能,应该认真考虑一下底层和数据结构了。

B公司

    B公司也是做的SNS网站,程序是3个人开发的,CEO是某名牌大学的经济学硕士,有点知己网的味道,又有一些特色出来,说实话,公司的潜力不错,CEO 有很强的运作能力,感觉前景不错。系统架构还行,但是---但是系统崩溃了,why?系统没有考虑到用户有个海量的说法,文件也有个海量的说法,用户的相 册,图片全部存贮在WEB服务器的一个分区上,每个用户一个目录,而打开性能监视器,磁盘的IO高的惊人,基本上无暇响应。众所周知,文件系统也是一个数 据库,单独大文件无所谓,关键是整个是300多个G的零碎文件,大量的读写操作,系统崩溃,数据丢失,文件系统的一个链断了,用户数据全部丢失!!!这是 一个非常沉重的问题,系统整整停了一个月来做数据恢复(单独文件很容易,但是海量文件目前还没有一个软件能组织起来软件架构)。解决方案:修改程序架构, 做分布式文件存贮(程序修改用了8天,但是文件转移却又用去了将近一个月),20万用户损失殆尽

    结论:WEB2.0前期的设计应该有应付海量存贮的考虑,整个涉及了程序架构的修改,前期规划不好的话基本上思路一条。

C公司

    C公司是一个值得尊敬的公司,CEO技术出身,和比尔盖茨一样,大学未毕业出来做网络,01到03年做短信狠赚了一笔,后来做的小项目也小有所成,说实 话,我很佩服。公司做的是校友方面,但是更偏重myspace风格,注重个人主页,推广方面也下了大手笔。系统崩溃的原因其实很简单,由于采用的是微软的 SqlServer,而微软直接就告诉了我们,SQLSERVER不支持集群,他们的数据库超负载,100%就没有下去过,只能横向增加配置,采用了4路 4核CPU系统,但是系统还是崩溃了... 高互动注定了高负载。解决方案: 现从基本入手,解决掉几个程序耗能大户,对数据库采用横向切割,将用户每10万进行分组,同时对数据库系统进行散列,将多个表垂直分割,同时进行文件分组 ,解决问题. 因为修改了数据结构,程序也基本上大动了一下。 好在系统没有出大错,损失不算很大,不过对用户体验造成了很坏的影响。

    结论:WEB2.0前期设计应该有良好的散列考虑,程序应该能有配合的扩充性,符合数据库的扩充

D公司

    D公司是一个各个方面做的比较好的公司,做了CDN加速,图片也独立分出了N个服务器,数据库不错的一个,(CTO是个数据库专家),系统崩溃的原因在于 WEB,按道理说WEB很容易做集群的,但是发现集群并解决不掉问题,他们的集群只允许做4台的WEB集群,但是4台都当掉了。仔细分析,找到原因,我估 计整个也是大部分CTO最容易犯的一个错误,或者说他们根本就想不到的问题,就是WEB上传的问题,上传的时候由于时间的原因,线程是保持链接的,300 个线程就可以把一个WEB Server当掉了。解决方案:这个最简单,把上传和其他耗能大户分离出独立出来。程序改动不是很大,但是之前半个月速度满对用户体验的损失也不可小视。

    结论:没有什么结论了,毕竟有海量访问经验的CTO不多,也就是那几个大站的。

    总结:不是泼冷水,模仿其实是很容易的,随便找几个WEB程序员就能做到,并且很简单,速度可能还很高效,因为WEB2.0无非就是跟数据库打交道,会操 作数据库就会做。但是真正做大并不容易,因为能应付海量访问的程序并不简单,现在的程序员都太自命不凡,其实真正有经验的并不多,不要相信一个月薪5K- -10K的程序员能给你多大的惊喜,能应付海量访问的程序员不是那个价格。如果您想做2.0,想做大,有几个个建议:

    一.找DBMS的专家设计好数据库,大部分程序员都不知道分区视图,数据散列,数据组的概念

    二.设计好程序架构(这个其实不难,有个高人指导就行了),保持良好的扩展性,成本考虑可以找兼职的系统架构设计师做好系统架构,确定将来的发展瓶颈。

    三.考虑好文件存贮的问题。文件存贮的技术含量看起来很低,其实是很高的,可以考虑反向代理的方案。文件存贮出问题了,站点基本上就完蛋了,不仅仅是RAID的问题和存贮服务器的问题,不过道理倒是一点就破的

    四.中国国情考虑,这个最致命,需要考虑电信和网通的问题,CDN并不能解决所有问题。互动性的东西并CDN并不是很有效。最关键的是,现有的双线机房遇 到DDOS攻击基本上都会当掉,原因很简单,双线机房都是私人机房,本身就不会有太高的带宽,随便攻击一下就可以D掉(顺带提一个笑话,我知道一个双线机 房的老总总共1G的带宽却买了4G的金盾墙,很简单800M的攻击就可以搞定)。

    五.网络延迟的问题,这是分布式系统必须要考虑的,程序要能容忍0到100秒的数据延迟的功能,也就是同步的问题。不要小看这几十秒,问题很大的,如果你 的站点有交互式功能,比如即时聊天,你可以想象一下是个什么结果。对于即时聊天的东西,可以用反向代理来解决(成本较高)。但是对于留言和评论的影响不 大,但是如果系统为了健壮做了缓存和静态化的时候,这个东西可能就是灾难性的了。

    六.分散你的程序,如果你没有太多的资金构筑动辄百万的服务器,建议把功能分散开来,比如相册一台服务器,留言一台服务器

    七.看好你的程序员,如果没有很好的激励措施的话你的程序员很容易写出敷衍性的代码,而这个可能就是将来的大患,程序架构定下来后要修改可能就要费牛劲了。最好你的CTO能对你100%的衷心,100%的负责。

    八.文件同步的问题,这个问题可能你觉得没有必要,如果你看一下网通和电信的TTL就明白了,同步要支持续传,并且不能是持续的,否则你的成本会高出N倍,不要期望能通过你的软件实现,交给你的程序员吧,把上面的话告诉他他就知道怎么做了。

    九.最狠的一个问题了,也是吃亏最大的问题,不管您跟网警的关系多好,看好你的用户,审核好你的东西,一被停机可能就致命,本人就吃过N次亏。

    十.最后,祝各位站长一番风顺,大展宏图。

Google Docs 发布 Google Presentation 演示文稿 在线 PowerPoint

Posted on : 18-09-2007 | By : leakon | In : Web2.0, 转载

0

Google Presentation正式发布,这样,Google Docs 就完整的整合Google Document,Google Spreadsheet和Google Presentation这三款产品。

Google Presentation

简单的试用了Google Presentation,使用方法和Google Document,Google Spreadsheet基本类似,支持在线协作,支持右键操作,支持模板更换(提供了十五种模板供选择),点击右上角的“Start Presentation”可以在线播放Presentation,基本上具备了Powerpoint常用的功能。

总的来说使用体验还算不错,Google Docs使用的比较多,一方面主要是其与Gmail的整合,另外一个使用比较多的功能那就是在线协作了。大家可以去尝试一下:)

链接:http://docs.google.com/

Alexa 排名 leakon.com

Posted on : 13-09-2007 | By : leakon | In : Web2.0, 原创

1

leakon.com 这个域名,我在 2004 年就注册了。

那个时候还不太懂技术,就租了一个虚拟主机,随便弄了几个 html 页面, 算是第一个我的个人网站。

后来,用 dreamweaver 弄了一个留言板,搞了一套韩国人做的模板,改成了一个小的动态个人网站。那是 2005 年的春节,马上大学毕业了。

考研来着,分数呢,四科总分加一起,还没人家最差的一门单科的分数高……

有了这个小网站的开发经历,也学了一点 ASP 方面的东西,到 5 月份就开始找工作。

6 月,到了以前的那个公司,开始搞 PHP。这算正式地、系统地学习一门新的语言,开发环境也完全变了,都是 FreeBSD。

我记得 2005 年那会儿,刚听说有 alexa 排名这个东西,后来查了一下,我的这个域名是 100 多万位,那会儿还挺满足的,心想,虽然名次低,但也算在世界排名上挂了号了,呵呵。

正式工作后,比较忙,一直没再管 leakon.com。

时隔 2 年,偶尔再查一下 alexa 排名,我已经降到 800 多万了……

后来,随着学到东西越来越多,发现以前熟悉的东西,长时间不用,就忘了。印象最深的就是半年前有一个想法,是利用 PHP 的一个很不常用的函数搞一个后台程序,那会儿只是实验性质的。

后来又有类似的需求时,怎么也想不起那个函数的名字,也不知道该如何描述,甚是苦闷。

我就想,应该把平时的积累存到一个记事本上,而现在的博客,就是一个很好的平台。

于是,6 月份,就用这个 wordpress 重新搭建了 leakon.com。

慢慢的,积累了几篇文章,大部分都是原创,我觉得,互联网需要丰富的内容,我们在不断获取他人经验的时候,也应该贡献一点自己的心得。最起码,记录下自己的技术积累,以后查的时候也比较方便。

无新插柳,又一次来到 alexa 居然看到自己的排名迅速狂飙!!!

前一段还不是很明显,只是从 800 多万上升到 400 多万。

现在查一下最近一周的排名,居然进前 100 万了!!

我觉得比较有意思的是另一项数据:三月变化趋势。

我的排名上升了 700 多万位!!!

开个玩笑说,如果是增幅的评比,恐怕可以进 Top 100 了吧。

用阿 Q 的思想,那么多烧钱的网站,搞了 2 年,alexa 增幅不过几千名,我这个网站 1 个月,增幅 700 万,是不是更厉害呀。

不过,目前还不是很稳定,说句实话,按照统计,这个 blog 每天也就 30 来个 PV,都是搜索引擎带过来的。

罗嗦半天,不如上几张图。这里可以查看最新的排名情况!

2007-9-7
alexa 2007-9-7

2007-9-11
alexa 2007-9-11

2007-9-13
alexa 2007-9-13

按过去一周的排名,又下降了不少。看来,这点 PV 还不足以稳固在 100 万以内。

这也告诉我,leakon.com 还缺少内容。

我会把我想的、做的都拿出来跟大家分享。

也请大家多支持我。

就 Web 2.0 的驱动力源泉分析,您的回复,或者参与,能够激发我更多的热情去贡献内容!