《電子技術應用》
您所在的位置:首頁 > 嵌入式技術 > 設計應用 > 基于Java編程的校內搜索軟件的設計
基于Java編程的校內搜索軟件的設計
來源:微型機與應用2012年第23期
孫文華
(南昌工程學院 網絡信息中心,江西 南昌 330099)
摘要: 如何在各高校內部成百上千個資源站點中,快速有效地查找到所需信息成為網絡用戶面臨的一個突出問題。為此提出了一款校內搜索引擎軟件的設計,解決了當前各高校大學生對本校信息難于快速有效獲取的問題。
Abstract:
Key words :

摘  要: 如何在各高校內部成百上千個資源站點中,快速有效地查找到所需信息成為網絡用戶面臨的一個突出問題。為此提出了一款校內搜索引擎軟件設計,解決了當前各高校大學生對本校信息難于快速有效獲取的問題。
關鍵詞: Java;校內;搜索引擎;設計

 當前,面對浩瀚的網絡資源,搜索引擎為所有網上沖浪的用戶提供了一個入口,所有的用戶都可以借助于搜索引擎到達自己想去的網上任何一個地方。隨著Internet的快速發展,海量信息和人們獲取所需信息能力之間的矛盾日益明顯,在信息海洋里查找信息,如同大海撈針一樣,而搜索引擎的出現正好解決了這一難題。
目前高校校內信息量的不斷增加,面對浩瀚的網絡信息,選擇資源范圍廣而針對性不強,很難搜到符合自己的資源。針對這種情況,本文提出了一款校內搜索軟件的設計與實現方法。該軟件采用Java語言開發,是一款簡易且實用的校內搜索引擎軟件。
1 設計原理
 搜索引擎系統[1]通常是指互聯網信息檢索系統。本系統是建立在通過網絡爬蟲軟件抓取大量的網絡資源的基礎上進行開發設計的,系統通過對抓取的網頁文件進行智能提取、去標注、內容分析等處理,再經過索引加載建立索引數據庫。用戶可以通過搜索頁面查詢索引數據庫,返回包含所有匹配查詢關鍵詞的網頁[2]。
校內搜索引擎軟件的設計原理如圖1所示,其原理如下:(1)通過網絡爬蟲軟件抓取網頁內容;(2)從抓取的網頁文件中獲取索引表,索引表內容為每個文件的序號與網址信息,得到網頁文件庫里面的內容即為網頁文件;(3)對得到的網頁文件庫進行處理,使用正則表達式去除網頁標注信息,得到的新內容存放在一個新的文件夾中,作為內容信息庫;(4)根據網頁文件庫和索引表,得到一個新的文件(也稱為標題和網址信息庫),其里面的內容為每個文件的序號、標題和網址等信息;(5)當用戶需要查找自己需要的信息時,只要輸入關鍵詞,搜索引擎軟件根據用戶輸入的關鍵詞在內容信息庫中進行查找[3],如果內容信息庫中存在用戶查找的內容,軟件將根據給內容所在的文件序號,在標題和網址信息庫中提取出該內容所在的標題與網址等信息,最后再加上內容信息庫中與關鍵詞相關的內容信息作為查找的結果顯示出來。

2 具體算法實現
 搜索引擎軟件開發環境:Myeclipse平臺,使用Java語言。首先可以Myeclipse平臺新建一個java project,在新建的project中需要導入下面一些相關的文件:
import java.io.BufferedReader;
import java.io.File;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.io.InputStreamReader;
import java.util.StringTokenizer;
 搜索引擎軟件中獲得搜索結果的搜索函數核心代碼如下:    
    //根據用戶輸入的關鍵詞,在相應的庫中進行搜索,并返回搜索結果信息
    private static String search(String[] str, int n, String filepath)
    {
        String all=null;
        File file=new File(filepath);
        try{
            String[] filelist=file.list();
            for(int i=0,flen=filelist.length;i<flen; i++)
            {
                File readfile=new File(filepath+"\\"+
 filelist[i]);
                String upname=readfile.getName();
                upname=upname.substring(0,upname.length
()-4);//去掉文件名中的.txt用于后面找網址
                BufferedReader br=new BufferedReader
(new FileReader(
                            readfile));
                String s="", ss=br.readLine();
                while (ss != null)
                {
                    s=s+ss;//s中存放文件內容的信息
                    ss=br.readLine();
                }
                //判斷當前讀入的記錄行中是否有
      //輸入的關鍵詞,輸入了幾個關鍵詞
                switch (n)
                {
                    case 1://1個關鍵詞的情況
                        int end=s.indexOf(str[0]);
                        if (end != -1)
                        {
                            upname=Url(upname);
//獲取存標題與網址信息
                            s=s.substring(end, 20);
//取關鍵字后的20個字符
                            all=all+"\n"+upname+"
關鍵字內容:"+s;
                                flag=1;
                                break;
                            } else
                                break;
                    case 2://2個及多個關鍵詞的情況
                            ......
                }
                br.close();//一定要關閉資源
            }
    } catch (FileNotFoundException e)
    {
        e.printStackTrace();
    } catch (IOException e)
    {
        e.printStackTrace();
    }
    return all;
 }
 搜索函數中調用的其他主要函數代碼如下:
    // 通過傳遞的文件名參數,在文件TitleInfo中查找得到與此文件名對應的標題信息+網址信息
    public static String Url(String filename)
    {
        String filepath="D:\\test\\TitleInfo\\TitleInfo.txt";
        File file=new File(filepath);
        String url="";
        try
        {
            BufferedReader br=new BufferedReader(new
 FileReader(file));
            String s=br.readLine();//讀入第一行信息
            while (s !=null)
            {
             if(s.indexOf(filename)!=-1)
                {
            url=s.substring(s.indexOf("標題"),s.length());
              //取該行標題后的信息
                    break;
                } else
                s=br.readLine();//讀入下一行的信息
            }
            br.close();//一定要關閉資源
        } catch (FileNotFoundException e)
        {
            e.printStackTrace();
        } catch (IOException e)
        {
            e.printStackTrace();
        }
        return url;
    }
 至此,完成了搜索引擎軟件代碼的編寫工作,接下來可以進行run操作(即可以在指定內容信息庫與標題和網址信息庫中進行操作),返回用戶查找的相關網頁文件的序號、標題、網址和主要內容等信息的結果。
3 實驗結果分析
 內容信息庫的存放路徑為D:\test\ContentInfo;內容信息庫中的內容如圖2所示。標題和網址信息庫的存放路徑為D:\test\TitleInfo;文件庫中存放了標題和網址信息文件,文件名為TitleInfo.txt,其內容如圖3所示。

 運行該搜索引擎軟件,得出的輸出結果如圖4所示。

 由圖4可以看到,通過該系統可以把待測文件中臟字及臟詞組出現的次數全部顯示出來,其結果與實際情況完全一致。
 針對當前網絡在高校的應用越來越普及,校內網絡中的資源也越來越多,而目前市場上的搜索軟件(如百度、谷歌的)又難以滿足實踐的需要,并且有些搜索軟件比較昂貴。本文在基于這些問題的情況下進行研究 與分析,提出了校內網絡資源搜索軟件的設計方法,并在Myeclipse環境下通過Java語言實現了這種方法,為高校校內網絡資源的搜索提供了一種方法。另外,可以在此基礎上進行二次開發,作者就在此基礎上完成了Web界面上的搜索(類似百度的功能)。本軟件在南昌工程學院已開始試用,如圖5所示。

 根據本文的設計原理,用戶可以根據自己的實際需要,在界面上改進與調整。
參考文獻
[1] 梁斌.走進搜索引擎[M].北京:電子工業出版社,2007.
[2] 宋春陽.Web搜索引擎技術綜述[J].現代計算機,2008(5).
[3] 徐寶文.搜索引擎與信息獲取技術[M].北京:清華大學出版社,2003.

此內容為AET網站原創,未經授權禁止轉載。
亚洲一区二区欧美_亚洲丝袜一区_99re亚洲国产精品_日韩亚洲一区二区
亚洲欧美日韩一区在线观看| 久久综合亚州| 欧美一区二区久久久| 一本久久精品一区二区| 亚洲国产一区二区精品专区| 国内精品美女av在线播放| 国产精品视频你懂的| 国产精品久久7| 欧美日韩一区在线观看视频| 欧美日韩精品一区二区| 欧美黄色aa电影| 欧美1区3d| 另类亚洲自拍| 美女主播精品视频一二三四| 久久久久久久性| 久久久久久久激情视频| 久久精品国产在热久久| 久久九九免费| 久久久久国产精品人| 久久久国产精品一区二区中文| 欧美与黑人午夜性猛交久久久| 欧美一区二区三区婷婷月色| 午夜在线观看免费一区| 午夜精品视频网站| 性色一区二区三区| 久久国产精品99久久久久久老狼| 久久国产精品久久久久久久久久| 久久久7777| 在线视频你懂得一区| 亚洲福利视频一区二区| 亚洲国产一区二区三区青草影视| 亚洲国产精品久久人人爱蜜臀| 亚洲激情国产精品| 夜夜嗨av色一区二区不卡| 亚洲午夜在线观看视频在线| 午夜精品免费在线| 久久成人综合视频| 蜜桃av噜噜一区| 欧美精品v日韩精品v国产精品| 欧美精品三级在线观看| 欧美视频在线观看一区| 国产欧美精品一区二区色综合 | 在线视频一区二区| 亚洲一区在线免费观看| 性欧美8khd高清极品| 亚洲国产精品一区制服丝袜| 9久re热视频在线精品| 亚洲一区影院| 久久在线免费| 欧美日韩久久| 国产亚洲精品bv在线观看| 亚洲高清av在线| 正在播放亚洲| 亚洲欧美在线观看| 最新日韩精品| 先锋影音国产一区| 另类图片国产| 欧美系列一区| 伊人久久综合97精品| 艳女tv在线观看国产一区| 欧美中文字幕在线视频| 在线视频欧美日韩| 久久久久欧美精品| 欧美精品成人91久久久久久久| 国产精品国产三级欧美二区| 精品不卡在线| 亚洲午夜久久久| 亚洲欧洲久久| 欧美一进一出视频| 欧美激情一区二区三区在线| 国产欧美精品一区二区色综合| 亚洲国产精品一区二区尤物区 | 午夜亚洲影视| 欧美黄污视频| 国内在线观看一区二区三区| 一区二区三区欧美成人| 亚洲国产精品久久久久婷婷老年 | 亚洲国产成人porn| 亚洲欧美第一页| 一二三四社区欧美黄| 久久视频精品在线| 国产精品美女一区二区在线观看| 最新国产成人在线观看| 亚洲欧美日韩一区| 亚洲性人人天天夜夜摸| 欧美成人情趣视频| 狠狠色狠狠色综合日日小说| 亚洲女与黑人做爰| 亚洲一卡久久| 欧美区一区二| 在线观看欧美日韩国产| 亚洲男人的天堂在线观看| 中文一区二区在线观看| 欧美成人一区二免费视频软件| 国产亚洲欧美日韩精品| 亚洲一区二区在线看| 亚洲一区一卡| 欧美日韩美女一区二区| 亚洲第一精品夜夜躁人人躁 | 亚洲国产精品久久91精品| 性色av一区二区怡红| 欧美日韩亚洲国产精品| 亚洲国产精品一区二区第四页av| 欧美一区二区三区在线免费观看| 亚洲欧美色婷婷| 欧美四级剧情无删版影片| 亚洲精品视频在线观看网站| 91久久国产精品91久久性色| 久久婷婷一区| 好吊视频一区二区三区四区| 午夜精品福利电影| 亚洲欧美美女| 香蕉久久a毛片| 国产精品日韩专区| 亚洲一区在线看| 亚洲欧美大片| 国产精品久久久久久久浪潮网站| 99re8这里有精品热视频免费| 99成人在线| 欧美精品一区三区| 亚洲国产高清一区| 亚洲免费av电影| 欧美jjzz| 亚洲欧洲一区二区三区在线观看 | 亚洲精品久久久久久久久| 免费不卡在线观看| 激情久久综艺| 亚洲国产日韩欧美一区二区三区| 久久久夜夜夜| 在线不卡欧美| 亚洲精华国产欧美| 欧美激情综合亚洲一二区| 亚洲日本一区二区三区| 一本久久综合亚洲鲁鲁五月天| 欧美伦理影院| 一区二区免费在线播放| 亚洲一区网站| 国产日韩欧美日韩| 欧美亚洲免费电影| 久久人91精品久久久久久不卡| 国内精品视频666| 亚洲日韩视频| 欧美日韩在线一区二区| 亚洲视频在线一区观看| 欧美亚洲视频在线观看| 好看的亚洲午夜视频在线| 亚洲国内精品在线| 欧美日韩的一区二区| 亚洲午夜激情网页| 久久精品二区| 亚洲国产免费看| 亚洲香蕉伊综合在人在线视看| 国产精品亚洲综合久久| 亚洲电影免费观看高清完整版| 欧美sm极限捆绑bd| 这里只有精品视频| 久久久久免费| 亚洲欧洲一区二区三区| 午夜精品偷拍| 韩国精品一区二区三区| 日韩一区二区精品| 国产精品网红福利| 91久久国产综合久久蜜月精品| 欧美日韩免费观看一区三区| 亚洲欧美福利一区二区| 蜜臀久久99精品久久久画质超高清 | 亚洲精品一级| 国产喷白浆一区二区三区| 亚洲高清视频的网址| 欧美视频在线观看一区| 久久国产精品高清| 欧美三级第一页| 久久精品99国产精品日本 | 影音先锋久久| 亚洲专区一区二区三区| 一区二区三区亚洲| 亚洲午夜久久久久久久久电影院| 国产日产高清欧美一区二区三区| 亚洲国产日韩在线一区模特| 国产精品久久久99| 亚洲精品美女在线| 国产区精品视频| 夜夜嗨av色综合久久久综合网| 国产精品一二| 一区二区三区久久精品| 激情六月婷婷久久| 亚洲一区在线视频| 亚洲国内高清视频| 久久久精彩视频| 亚洲天堂成人| 欧美精品一区二区三区久久久竹菊 | 久久免费偷拍视频| 亚洲午夜国产成人av电影男同| 噜噜噜噜噜久久久久久91| 在线一区二区三区四区五区| 欧美大片一区二区三区| 先锋影音久久久| 国产精品久久999| 一区二区国产精品| 亚洲第一中文字幕|