請教一下高手,用JAVA編寫一個程序能統計每個長度的單詞的數量
import *;
import *r;
import *Tokenizer;
public class Test {
public static void main(String[] args) {
Scanner scan = new Scanner(*);
String str = *ne();
StringTokenizer st = new StringTokenizer(str, " ");
int total = *okens();
int len[] = new int[20];
*(len, 0);
while (*eTokens()) {
String s = *ken();
len[*()]++;
}
*n("長度 個數");
int max = 1;
for (int i = 1; i 0)
max = i;
}
for (int i = 1; i
如何對語料庫進行指定詞語查詢統計軟件
語料庫建設中涉及的主要問題包括:
(1) 設計和規劃:主要考慮語料庫的用途、類型、規模、實現手段、質量保證、可擴展性等。
(2) 語料的采集:主要考慮語料獲取、數據格式、字符編碼、語料分類、文本描述,以及各類語料的比例以保持平衡性等。
(3) 語料的加工:包括標注項目(詞語單位、詞性、句法、語義、語體、篇章結構等)標記集、標注規范和加工方式。
(4) 語料管理系統的建設:包括數據維護(語料錄入、校對、存儲、修改、刪除及語料描述信息項目管理)、語料自動加工(分詞、標注、文本分割、合并、標記處理等)、用戶功能(查詢、檢索、統計、打印等)。
(5) 語料庫的應用:針對語言學理論和應用領域中的各種問題,研究和開發處理語料的算法和軟件工具。
我國語料庫的建設始于80年代,當時的主要目標是漢語詞匯統計研究。進入90年代以后,語料庫方法在自然語言信息處理領域得到了廣泛的應用,建立了各種類型的語料庫,研究的內容涉及語料庫建設中的各個問題。90年代末到新世紀初這幾年是語料庫開發和應用的進一步發展時期,除了語言信息處理和言語工程領域以外,語料庫方法在語言教學、詞典編纂、現代漢語和漢語史研究等方面也得到了越來越多的應用。
語料庫與語言信息處理有著某種天然的聯系。當人們還不了解語料庫方法的時候,在自然語言理解和生成、機器翻譯等研究中,分析語言的主要方法是基于規則的(Rule-based)。對于用規則無法表達或不能涵蓋的語言事實,計算機就很難處理。語料庫出現以后,人們利用它對大規模的自然語言進行調查和統計,建立統計語言模型,研究和應用基于統計的(Statistical-based)語言處理技術,在信息檢索、文本分類、文本過濾、信息抽取等應用方向取得了進展。另一方面,語言信息處理技術的發展也為語料庫的建設提供了支持。從字符編碼、文本輸入和整理,語料的自動分詞和標注,到語料的統計和檢索,自然語言信息處理的研究都為語料的加工提供了關鍵性的技術。
有沒有可以檢查英語單詞記憶的軟件
先說一句,正兒八經背單詞,最好還是找臺電腦吧。
iPhone 那么小的屏幕,還有各種干擾,你能堅持多長時間?半個小時?一個小時?完全自由編輯 list 的應用還真不多。推薦兩個:Byki、有道詞典。
對于 Byki,如果要自定 list,需購買桌面高級版,略貴。 不過操作傻瓜,并且用它背單詞真的真的很好。
對于有道詞典,可以自建 list,然后手動一個單詞一個單詞地添加。批量導入大量自制 list 單詞,也可以。
有道詞典生詞本是一個 xml 文件,按照下面的格式自己寫就行了: 單詞 list 名字 該單詞熟悉程度,默認為 1,最低###biscuit 值得一用!###推薦百詞斬,沒明白什么叫自定義單詞列表。
單詞詞頻統計程序設計:對任意長文本文件,統計并列表輸出其中每個
青少年是祖國的花朵,是祖國的未來。在鮮艷的五星紅旗下,一代又一代青少年在茁壯成長,涌現出了許多英雄和楷模。他們成了我們這個偉大時代最耀眼的新星。我最近看了一本書,叫《孝行天下》。這本書講的是:原岳陽縣高三學生陶星在父親患病去世后,14歲開始帶著智障的母親上學。除了照料母親的一日之餐,陶星還教母親刷牙,幫母親洗臉、洗身子、洗衣服。
冬天怕母親受凍,把母親的雙腳摟在懷里。后來,在老師同學和許多好心人的幫助下,陶星度過了他生命中第一個沒有父母陪伴的新年。我看了這本書后,我大吃一驚。我想:陶星真孝順父母呀!在那么苦的情況下生活,學習都很困難,更何況還要照顧一個帶病的母親!現在的孩子,都是衣來伸手,飯來張口。動不動還對父母又打又罵。怎么會孝順父母呢?就說我吧,我在家里,心情好就幫媽媽捶背,干家務,心情不好,就關上房門,獨自一人生悶氣,也不理爸爸媽媽。
自從我看了《孝行天下》這本書后,我想:我不應該對父母發脾氣。我真佩服陶星,我要向他學習。
文本單詞統計程序設計 對任意長文本文件,分類統計其中出現的英文單
你的代碼邏輯有點亂,我初步看了,至少在第37-39行是有問題的,這3行的意思是:如果讀取的字符不是字母就繼續讀,可是如果到了文件末尾,你的代碼也不會停下來,因為你沒有調用feof(in)測試是否到達了文件末尾。
這種文本統計的問題,用c做實在費事。我用c++做過,也很費事。
后來用perl做過,只需要一行代碼就夠了。perl -e "for(){$n{$_}++ for /(\w+)/g} say $n{$_}, ' ',$_ for sort keys %n" *你可以安裝perl后,試試。
有c的基礎,建議你學學perl或其他動態語言,對日常工作幫助會很大。祝你成功!。