预览模式: 普通 | 列表

WEB 架构设计的理解

      本人作为一位web工程师,着眼最多之处莫过于性能与架构,本次幸得参与sd2.0大会,得以与同行广泛交流,于此二方面,有些心得,不敢独享,与众博友分享,本文是这次参会与众同撩交流的心得,有兴趣者可以查看视频。
 
架构设计的几个心得:

一,不要过设计:never over design

      这是一个常常被提及的话题,但是只要想想你的架构里有多少功能是根本没有用到,或者最后废弃的,就能明白其重要性了,初涉架构设计,往往倾向于设计大而化一的架构,希望设计出具有无比扩展性,能适应一切需求的增加架构,web开发领域是个非常动态的过程,我们很难预测下个星期的变化,而又需要对变化做出最快最有效的响应。。ebay的工程师说过,他们的架构设计从来都不能满足系统的增长,所以他们的系统永远都在推翻重做。请注意,不是ebay架构师的能力有问题,他们设计的架构总是建立旧版本的瓶颈上,希望通过新的架构带来突破,然而新架构带来的突破总是在很短的时间内就被新增需求淹没,于是他们不得不又使用新的架构。
       web
开发,是个非常敏捷的过程,变化随时都在产生,用户需求千变万化,许多方面偶然性非常高,较之软件开发,希望用一个架构规划以后的所有设计,是不现实的。

[阅读全文]

标签: 架构设计

电子数据交换 (EDI)

摘要:电子数据交换在ERP系统尤其是在供应链管理的数据传输中仍旧起着重要作用。本文介绍电子数据交换(EDI)的基本概念、EDI的结构、EDI的业务流程、实施EDI的效益、EDI的现状与前景。

关键字:EDI结构、业务流程、效益、现状、前景当今世界,信息技术正以其强大的渗透力,深入到社会经济生活的各个方面。在商业金融等领域,电子数据交换(Electronic Data Interchange,简称EDI)作为一种新的商务手段正在被广泛使用,以取代传统的商务交易方式。

[阅读全文]

[转]Web X.0 你将去向何方?

看完这篇博文找到了一些共鸣.....

原文地址:http://tech.it168.com/i/2008-03-27/200803270832932.shtml
作者:gsofhon 

  还没有从Semantic Web的震动中清醒过来,Jain带着EventWeb再次冲击了我脆弱的神经。

EventWeb,事件网。不知道这么翻译合不合适,总之觉得比语义网更玄乎。不过这里说的事件并不是程序员所熟知的事件,而是“突发事件看凤凰”里面的事件。又是一个微妙的语义问题,引出了一个全新的网络思维。

  事件网把与一个事件相关的所有的侧面信息,包括文本、图片、视频、音频、甚至触感这些可以被计算机描述的信息都提供给用户。随之而来的问题是如何有效的创建,描述,关联,索引和访问这些复杂的多媒体信息。这将是一个全媒体网络。事件网帮助用户“身临其境”,并从这些体验中深入的“洞察”事件,进而帮助用户得到新的思维。

[阅读全文]

标签: Web X.0

余弦定律的文本相似判断

  最近很忙,很久没有更新上面的内容了。今天就记录点东西吧,最近在做一个系统想到做一个近似的判断的功能来处理数据库中现在有数据的冗余。

  文本包含的各个词及其出现的频率可以构成一个表示该段文本的特征向量,而通过余弦定理可以计算任何两个向量的夹角,夹角越小就说明二者越接近。

  貌似没有比这个更好更体现数学之美的算法了,可是,判断两断内容的相似程度是简单的,如果是20万段内容,判断其两两之间的相似程度,又该怎么做呢?进行简单的两两选择,一共会有将近400万条数据,而可以确定的是,其中大部分都是没用的。

SaaS理念介绍[PPT演示文档]

  SaaS是Software-as-a-service(软件即服务)的简称,它是一种通过Internet提供软件的模式,用户不用再购买软件,而改用向提供商租用基于Web的软件,来管理企业经营活动,且无需对软件进行维护,服务提供商会全权管理和维护软件,对于许多小型企业来说,SaaS是采用先进技术的最好途径,它消除了企业购买、构建和维护基础设施和应用程序的需要,近年来,SaaS的兴起已经给传统套装软件厂商带来真实的压力。

attachments/200803/3884975924.jpg

[阅读全文]

常见的开源协议

参考文献:http://www.fsf.org/licensing/licenses/

现今存在的开源协议很多,而经过Open Source Initiative组织通过批准的开源协议目前有58种(http://www.opensource.org/licenses/alphabetical)。我们在常见的开源协议如BSD, GPL, LGPL,MIT等都是OSI批准的协议。如果要开源自己的代码,最好也是选择这些被批准的开源协议。

这里我们来看四种最常用的开源协议及它们的适用范围,供那些准备开源或者使用开源产品的开发人员/厂家参考。

[阅读全文]

也谈中文分词

中文分词的应用

  中文分词主要应用于信息检索、人机交互、信息提取、文本挖掘、中外文对译、中文校对、自动摘要、自动分类等很多方面。下面就以信息检索为例来说明中文分词的应用。
  目前的分词算法中,一些切分精度比较高的算法,切分的速度都比较慢;而一些切分速度快的算法,因为抛弃了一些繁琐的语言处理,所以切分精度都不高。

速度:每秒几十k~几M

  切分正确率:80%~98%   

[阅读全文]