複製鏈接
請複製以下鏈接發送給好友

企業級搜索

鎖定
調研結果顯示,當前海量數據環境下的檢索服務效率已經成為專利機構、圖書情報機構、媒體和政府等信息資源集中的單位提供高質量信息服務的瓶頸。
中文名
企業級搜索
源    自
當前信息規模的爆炸式膨脹
性    質
應用
實    現
負載均衡

企業級搜索海量數據處理能力

企業搜索應用源自當前信息規模的爆炸式膨脹和信息資源共享的普遍需求,特別是對佔信息資源總量80%以上的非結構化數據而言,檢索要應對兩方面的挑戰:
第一:當數據規模達到T級時,單台服務器已經遠遠不能滿足數據存儲和管理需要,因此需要部署多台服務器進行分佈式存儲,但必須實現統一檢索;
第二:在多用户高併發訪問的情況下,海量數據規模使檢索性能急劇降低,必須採用多台服務器分擔檢索響應,保證檢索效率。
企業搜索需要實現海量數據分佈存儲和高併發訪問負載均衡,並支持兩種手段的組合運用,可保證用户系統在海量數據和高併發環境下的分佈式檢索的高性能。同時,通過集羣也能輕鬆實現消除單點故障的高可用系統,滿足用户的可靠性要求。
企業搜索需要採用最新優化算法,改良了緩存(CACHE)機制,並針對近年軟硬件平台發展,比如64位處理器操作系統、多處理器(SMP)體系結構等實現了相應支持和優化,淋漓盡致地發揮出最新軟硬件平台的優勢,令單機環境系統性能較上一版本取得了成倍的提升。

企業級搜索可靠有效的高查全率和查準率

用户在使用Google等互聯網搜索引擎時,經常可以發現搜索引擎顯示的搜索數目並不準確:搜索引擎顯示搜索到幾十萬條信息,實際通過翻頁可以看到展示出來的信息也就幾百條。而且,有些明明符合條件的信息可能就是搜不出來。這與互聯網搜索引擎面對網頁數據特性所採取的PageRank、TOP N、結果預估等算法或策略相關。相應的,統計表明,搜索用户絕大部分的訪問限於搜索結果的前幾個頁面。然而,企業搜索的應用環境、用户需求和互聯網搜索有很大不同,企業搜索是為組織業務決策和運轉而服務的,要做到精準,需要全面獲取搜索結果並且不能有任何疏漏,因而需要保證高查全率和查準率。
企業搜索需要支持多種索引策略、全方位檢索手段、智能檢索輔助、內容相關度排序等功能,在保證用户查準的同時,提供100%查全手段,滿足企業搜索引擎對查全和查準的雙重要求。

企業級搜索結構化和非結構化統一搜索

除強調信息檢索的全面和準確之外,企業級搜索面對的另一個難題就是複雜的數據異構性,即組織中各種類型的數據存放在不同的系統中,既有非結構化數據也有結構化數據,既有關係數據庫系統,也有OA系統、網站內容管理系統、文件系統、以及郵件系統等。因此,結構化數據和非結構化數據統一搜索和管理是重中之重。
線點科技企業搜索數據存儲方面提供多種結構化數據類型,檢索方面實現結構化數據非結構化數據的聯合檢索,並可以對檢索結果進行分類統計,這些都是傳統全文檢索系統或者搜索引擎所不能提供的領先和創新的功能。在異構數據集成方面,需要提供了多種接口工具實現與不同系統的數據同步
線點科技企業搜索也能夠實現動態索引以及多級訪問安全機制,保證企業搜索所必備的即時性和安全性,為搭建基於企業搜索的各類應用,如信息服務、知識管理、決策支持,應急預警等提供了功能強大、完備和可靠的核心支撐平台。

企業級搜索線點科技企業搜索平台

-
線點科技企業搜索引擎
Google、百度等
信息內容
防火牆內的信息 (內網信息),異構系統中的信息(如郵件、辦公、數據庫、ERP、CRM等,Domino)
互聯網信息
核心技術
基於內容本身的相關排序更高的查全率和查準率要求 安全性 實時性
基於網頁鏈接數的重要性排序(PageRank),
預估最相關的N個結果(Top N)
商業模式
軟件+服務(License、SaaS、定製開發、收費服務等)
廣告
終端客户
企業客户
個人用户