主頁 > 知識庫 > MongoDB實現(xiàn)基于關(guān)鍵詞的文章檢索功能(C#版)

MongoDB實現(xiàn)基于關(guān)鍵詞的文章檢索功能(C#版)

熱門標簽:機器人外呼系統(tǒng)軟件存在問題 智能電銷機器人銷售話術(shù) 福州電銷機器人源代碼 兗州電話外呼營銷系統(tǒng) 南京400電話怎樣辦理 徐州ai電銷機器人原理 沈陽營銷電銷機器人招商 企業(yè)智能外呼系統(tǒng)價格多少 高德地圖標注商戶位置

我的實現(xiàn)目標是:

可以通過一個或多個關(guān)鍵詞搜索到文章。

可以通過文章的關(guān)鍵詞列表查詢到其相關(guān)文章。

查詢到的結(jié)果依據(jù)相關(guān)程度降序排列。

查詢速度要夠快。(理論上關(guān)鍵詞檢索比全文檢索要快很多的)

在網(wǎng)上找了一大圈,就沒有一個靠譜的方法,基本都是只能傳入單詞來檢索,而且基本都沒有提供C#驅(qū)動版本的代碼,于是乎自己研究出了這個實現(xiàn)方案:

首先要求使用標簽、分詞、關(guān)鍵詞提取組件對文章對應(yīng)的關(guān)鍵詞進行提取,然后作為數(shù)組格式,存入文章的Keywords字段中。

核心檢索代碼:

/// summary>
/// 根據(jù)關(guān)鍵詞獲取文章編號與標題映射。
/// 注意:此方法會返回最為匹配的若干個項目,并根據(jù)匹配程度降序排列,即使是沒有任何關(guān)鍵詞匹配項,也會返回若干個結(jié)果的。
/// 另需注意:如果是根據(jù)文章關(guān)鍵詞來查詢,一般來說其中一定包含原文章,所以應(yīng)該把期望獲得的數(shù)量加1,并在結(jié)果中移除原文。
/// /summary>
/// param name="limitNum">數(shù)量上限/param>
/// param name="keywords">關(guān)鍵詞集合/param>
/// returns>文章編號與標題映射字典/returns>
public async TaskDictionaryGuid, string>> GetArticleDicByKeywordsAsync(int limitNum, IEnumerablestring> keywords)
{
var list =
await
Database.GetCollectionDomain.Entity.Article>("Article").Aggregate()
.Match(q => !q.IsDeleted  q.Keywords != null)
.Project(q => new { q.Id, q.Title, Count = q.Keywords.Count(t => keywords.Contains(t)) })
.SortByDescending(q => q.Count)
.Limit(limitNum)
.ToListAsync();
return list.ToDictionary(f => f.Id, f => f.Title);
}

注意:這里一定要用Aggregate()方法做聚合,而不是常用的Find()方法做查詢,F(xiàn)ind()方法后面跟Project()方法也不會改變方法鏈中操作的對象類型,這樣后面的SortByDescending()方法的目標對象還是Article類,而不是Project()方法中定義的匿名類,而SortByDescending()方法中傳入的表達式又僅允許用來選擇對象屬性,不允許進行任何計算,所以就根本無法實現(xiàn)我們的需求,我在發(fā)現(xiàn)Aggregate()方法之前就在這里一直卡著很久~

用作關(guān)鍵詞搜索時一般就是把關(guān)鍵詞傳入就可以了,不過傳回的結(jié)果也有可能壓根沒有匹配到任何關(guān)鍵詞,所以最好在發(fā)給用戶前再檢查一遍項目的匹配程度,把沒有任何匹配的結(jié)果濾掉。

用作相關(guān)文章搜索時,直接把原文章的Keywords屬性值傳入,獲取數(shù)量要比你預(yù)計的數(shù)量多1,因為非??赡苣愕脑恼戮驮讷@取到的列表中,而且是前列,獲取后濾掉原文章的ID,再執(zhí)行Take方法返回你需要數(shù)量的項目即可(執(zhí)行Take方法是為了以防你的原文沒出現(xiàn)在列表中,這概率極小但也是有的)。

為了增進查詢效率,還可以預(yù)設(shè)好索引,代碼如下:

var c=Database.GetCollectionDomain.Entity.Article>("Article");
c.Indexes.DropAll();
await c.Indexes.CreateOneAsync(
BuildersDomain.Entity.Article>.IndexKeys.Ascending(q => q.Keywords));
//參考自:http://mongodb.github.io/mongo-csharp-driver/2.2/reference/driver/admin/#creating-an-index

所使用的C#官方驅(qū)動版本是:MongoDB.Driver.2.2.3

您可能感興趣的文章:
  • C#簡單操作MongoDB的步驟全紀錄
  • C#中如何將MongoDB->RunCommand結(jié)果映射到業(yè)務(wù)類的方法總結(jié)
  • Mongodb在CSharp里實現(xiàn)Aggregate實例
  • C#中使用1.7版本驅(qū)動操作MongoDB簡單例子
  • MongoDB入門教程之C#驅(qū)動操作實例
  • C# 對MongoDB 進行增刪改查的簡單操作實例
  • 關(guān)于C#生成MongoDB中ObjectId的實現(xiàn)方法
  • C#基于Mongo的官方驅(qū)動手擼一個Super簡易版MongoDB-ORM框架

標簽:景德鎮(zhèn) 大理 邯鄲 本溪 吉安 昭通 鶴崗 丹東

巨人網(wǎng)絡(luò)通訊聲明:本文標題《MongoDB實現(xiàn)基于關(guān)鍵詞的文章檢索功能(C#版)》,本文關(guān)鍵詞  MongoDB,實現(xiàn),基于,關(guān)鍵詞,;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 下面列出與本文章《MongoDB實現(xiàn)基于關(guān)鍵詞的文章檢索功能(C#版)》相關(guān)的同類信息!
  • 本頁收集關(guān)于MongoDB實現(xiàn)基于關(guān)鍵詞的文章檢索功能(C#版)的相關(guān)信息資訊供網(wǎng)民參考!
  • 推薦文章