玻森:语义理解+企业信息查询,用“火眼金睛”照亮企业风险 | 创业

跟从前大热的“互联网+”相同,人工智能的价值其实也并不仅仅在技能自身,而是在于技能与职业的结合,即“AI+职业”。
当然,看见这个趋势的企业并不在少量,市面上也早已呈现了一大批AI+视频监控、AI+客服……的AI公司。咱们今日即将介绍的则是一家AI+企业信息查询的公司:玻森数据。
据了解,玻森数据的AI+企业信息查询东西名叫“
风报
”。风报不乏强壮竞争者
提到企业信息查询类东西,笔者首要想到的是企查查、企信宝、天眼查等产品。关于风报与这些产品的差异,玻森数据COO 顾佳庆标明,首要差异是产品定位不相同。
“风报从一开端就旨在为企业级客户、金融组织、律师及管帐事务所等专业组织供给企业情报及危险办理服务。”顾佳庆介绍二者的差异就像是“数据查找查询”和“数据处理剖析”之间的差异。
“其他查老板查联系的2C类产品,首要供给一些根底的信息罗列和汇总,可根本满意个人用户的需求,不过看似能够获取许多的数据,但其中心仍是在玩工商数据。工商数据相对简略获取,且比较简略汇总和展现。”顾佳庆标明风报作为一款2B类产品,能够在数据的全面精准及深度剖析上满意B端客户更高的需求。
而风报之所以能够做到这一点,首要归功于他们具有NLP自然语言处理才干。
“NLP技能的深度处理才干,有助于企业高效获取精准数据,智能提取各类实体(如公司、相关、标签等),智能解析司法诉讼、企业事情等数据相关,这是风报的中心优势之一。”顾佳庆标明,企业信息触及许多的裁判文书等非结构化文本,提炼要害信息要进行去重、实体抽取、分词、清洗及剖析等,而这些不是依托简略的信息汇总就能完结的,首要就需求有NLP才干。
据了解,依据NLP语义剖析的相关剖析是风报最重要的优势之一。“风报的相关剖析不仅仅是供给企业的单一直线相关,而是将企业、人、事情等层层揭穿,供给了多重穿插相相联系,并可追溯其相关途径,从而有利于发掘潜在的疑似相关。”
“比方经过咱们的高档相关导航,用户能够去查询公司和其典当公司的相相联系,举个比如假如发现两家公司经过多家金融组织相相关,很有或许是一家金融组织对自己不信任,逐级介绍,或许数额太大,危险也太大,一家组织消化不了,就多家组织相互介绍,从中抽成或分管,那就有或许标明该公司在资金运转上存在许多问题。”玻森方面介绍称依据NLP的相关剖析能够有效地发现企业运营等方面的危险。
顾佳庆着重风报的方针客户是愈加高端的B端用户,“2B类产品,需求咱们对职业的了解更为专业、透彻,对数据处理服务才干更为谨慎、深化,假如有人以为咱们跟其他2C类的产品是相同的,那这个人就肯定不是咱们的方针用户,咱们的方针用户是那种一看见咱们的产品,便会发现咱们愈加深化的剖析才干正是他们所急切需求的。”一般来说,点评一个产品好坏并不是看开创人说什么,而应该看用户是否愿意为这个产品买单。而实际上,“风报现已得到了包含我国安全、远东租借等在内的超越500家长时刻付费用户的支撑,他们在前期的收购时也会做比较,但终究挑选了咱们,这也证明了咱们的产品价值。”顾佳庆骄傲地标明。
中心壁垒:中文语义剖析才干
据介绍,风报所运用的NLP技能是由其开创团队于2012年开端研制,2013年正式上线了BosonNLP中文语义敞开渠道,各行各业的用户都能够经过该敞开渠道剖析他们的数据,而这就是玻森另一项极具潜力价值的事务。
技能上,依据玻森供给的一份包含BosonNLP在内的11款敞开中文分词引擎的评测成果显现,BosonNLP的分词准确度实属上乘:

“并且,在国内自然语言处理最威望的竞赛-NLPCC公开赛上,玻森数据还曾接连两年取得中文分词与词性标示两项竞赛的榜首。”顾佳庆此外还标明玻森在自然语言情感剖析范畴也具有必定的优势:“玻森NLP情感引擎供给职业抢先的华章级情感剖析。依据上百万条交际网络平衡语料和数十万条新闻平衡语料的机器学习模型,结合自主开发的半监督学习技能,咱们的正负面情感剖析准确度到达80%~85% ,而经过职业数据标示学习后准确率更是可达85%~90%。”
因而,作为一个底层的、通用的技能渠道,BosonNLP依旧是玻森现在的要点,不过在现阶段,BosonNLP只要与详细职业结合才干出最大的价值。而风报则是玻森经过BosonNLP的根底引擎,结合职业经历,对工业生态做进一步的深度剖析加工,为工业供给商业级的使用服务。
关于BosonNLP的其他使用,顾佳庆现阶段的想象是用户先用BosonNLP做数据的开端处理,之后再经过工业生态做进一步的深度剖析加工。不过,因为工业生态的完善还需求时刻,顾佳庆以为5至10年之后,BosonNLP有望成为玻森的中心事务之一,是当之无愧的潜力股。
据了解,玻森现在有职工约60人,现已有过三轮融资,最近在做B轮。
题图来自123rf