一、研究進(jìn)展情況
一、總體計(jì)劃執(zhí)行情況及子課題進(jìn)展情況
1、總體計(jì)劃執(zhí)行情況
本項(xiàng)目于2017年5月5日開(kāi)題,之后各課題組在能順暢溝通交流的前提下分別進(jìn)行研究,依據(jù)項(xiàng)目完成的成果要求,
已完成:
1)“中國(guó)—中南半島經(jīng)濟(jì)走廊規(guī)劃需求下的數(shù)據(jù)庫(kù)規(guī)劃設(shè)計(jì)研究報(bào)告”
2)互聯(lián)網(wǎng)數(shù)據(jù)采集及存儲(chǔ)子系統(tǒng)(軟件)
3)數(shù)據(jù)可視化子系統(tǒng)(軟件)
4)衛(wèi)星數(shù)據(jù)采集與管理子系統(tǒng)(軟件)
5)數(shù)據(jù)庫(kù)安全系統(tǒng)(軟件)
6)系統(tǒng)終端安全系統(tǒng)(軟件)
7)“云翻譯數(shù)據(jù)中心”的軟件需求分析
8)“生產(chǎn)線自動(dòng)控制子系統(tǒng)”的軟件需求分析
9)“數(shù)據(jù)挖掘——人物背景分析”的軟件需求分析
10)“數(shù)據(jù)挖掘——投資環(huán)境分析”的軟件需求分析
11)“大數(shù)據(jù)應(yīng)用——城市建設(shè)和港口建設(shè)預(yù)測(cè)”的軟件需求分析
12)“中國(guó)—中南半島經(jīng)濟(jì)走廊沿線國(guó)家金融平臺(tái)子系統(tǒng)”的軟件需求分析
13)參加國(guó)際會(huì)議7次,舉辦國(guó)際會(huì)議6次,與柬埔寨前副首相及技術(shù)人員討論信息數(shù)據(jù)應(yīng)用1次
14)發(fā)表論文67篇,錄用論文7篇
15)對(duì)采集回來(lái)的數(shù)據(jù)進(jìn)行分析研究并生成各類(lèi)報(bào)告,其中有10份報(bào)告獲各級(jí)領(lǐng)導(dǎo)批示
16)目前已采集數(shù)據(jù)15億3千萬(wàn)條,日更新數(shù)據(jù)20萬(wàn)條
17)中國(guó)-東盟全息數(shù)據(jù)研究與資訊中心建設(shè)
18)已建設(shè)一個(gè)包含54臺(tái)服務(wù)器的具有高可靠、高可用的系統(tǒng)硬件平臺(tái)
整體項(xiàng)目待完成任務(wù):
1)“云翻譯數(shù)據(jù)中心”的軟件開(kāi)發(fā)
2)“生產(chǎn)線自動(dòng)控制子系統(tǒng)”的軟件開(kāi)發(fā)
3)“數(shù)據(jù)挖掘——人物背景分析”的軟件開(kāi)發(fā)
4)“數(shù)據(jù)挖掘——投資環(huán)境分析”的軟件開(kāi)發(fā)
5)“大數(shù)據(jù)應(yīng)用——城市建設(shè)和港口建設(shè)預(yù)測(cè)”的軟件開(kāi)發(fā)
6)“中國(guó)—中南半島經(jīng)濟(jì)走廊沿線國(guó)家金融平臺(tái)子系統(tǒng)”的軟件開(kāi)發(fā)
按照這個(gè)進(jìn)度,如果有較多的滾動(dòng)經(jīng)費(fèi)補(bǔ)充,項(xiàng)目能更好按時(shí)完成。
2、各子課題進(jìn)展情況
1)子課題之一:中國(guó)-中南半島規(guī)劃需求下的數(shù)據(jù)庫(kù)規(guī)劃與設(shè)計(jì)
已全部完成。完成了“中國(guó)—中南半島經(jīng)濟(jì)走廊規(guī)劃需求下的數(shù)據(jù)庫(kù)規(guī)劃設(shè)計(jì)研究報(bào)告”
2)子課題之二:中國(guó)—中南半島經(jīng)濟(jì)走廊沿線綜合數(shù)據(jù)庫(kù)的數(shù)據(jù)采集與存儲(chǔ)
已全部完成。
① 課題進(jìn)展情況:
完成了要求的軟件系統(tǒng)開(kāi)發(fā):互聯(lián)網(wǎng)數(shù)據(jù)采集及存儲(chǔ)子系統(tǒng)(軟件),數(shù)據(jù)可視化子系統(tǒng) (軟件),衛(wèi)星數(shù)據(jù)采集與管理子系統(tǒng)(軟件)
② 調(diào)查研究及學(xué)術(shù)交流情況:
進(jìn)行數(shù)據(jù)采集子系統(tǒng)、數(shù)據(jù)可視化子系統(tǒng)和衛(wèi)星數(shù)據(jù)采集與管理子系統(tǒng)需求分析調(diào)研,完成了這三個(gè)子系統(tǒng)業(yè)務(wù)需求書(shū)及開(kāi)發(fā),參加6次國(guó)際學(xué)術(shù)會(huì)議,舉辦5次國(guó)際會(huì)議。
項(xiàng)目首席專(zhuān)家作為訪問(wèn)學(xué)者,2017.5—2018.5在美國(guó)德州大學(xué)進(jìn)行訪學(xué),期間參與了他們一個(gè)項(xiàng)目的數(shù)據(jù)采集相關(guān)工作。
③ 成果宣傳推介情況
各級(jí)領(lǐng)導(dǎo)、各個(gè)單位視察該系統(tǒng)不少于50次,每次均獲得很好評(píng)價(jià);
采集數(shù)據(jù)的動(dòng)態(tài)展示頁(yè)面:
④ 研究中存在的主要問(wèn)題、改進(jìn)措施,研究心得、意見(jiàn)建議
無(wú)
⑤ 其他需要說(shuō)明的問(wèn)題
無(wú)
3)子課題之三:中國(guó)—中南半島經(jīng)濟(jì)走廊沿線綜合數(shù)據(jù)庫(kù)的數(shù)據(jù)挖掘與大數(shù)據(jù)技術(shù)應(yīng)用
正在進(jìn)行。
① 課題進(jìn)展情況:
主要進(jìn)行中國(guó)—中南半島經(jīng)濟(jì)走廊沿線各國(guó)人物背景分析和投資環(huán)境分析的研究,包括人物背景分析的數(shù)據(jù)源下載、實(shí)體抽取和人物社會(huì)關(guān)系的分析,性格分析,投資環(huán)境分析中中長(zhǎng)期預(yù)測(cè),取得了一些階段性成果,包括基于關(guān)注行為預(yù)測(cè)的關(guān)注對(duì)象推薦,基于話題排序的通用話題建模,基于時(shí)間卷積和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的時(shí)間序列預(yù)測(cè)模型,融合微博情感分析和深度學(xué)習(xí)的宏觀經(jīng)濟(jì)預(yù)測(cè),基于遠(yuǎn)域適應(yīng)的文本分類(lèi),話題權(quán)威度敏感的影響最大化,用于云存儲(chǔ)的一套高性能兩方去重方法等方面的研究,發(fā)表錄用期刊論文2篇,發(fā)表及錄用會(huì)議論文5篇,進(jìn)展順利。
② 調(diào)查研究及學(xué)術(shù)交流情況:
進(jìn)行數(shù)據(jù)挖掘子系統(tǒng)需求分析調(diào)研,完成了數(shù)據(jù)挖掘子系統(tǒng)業(yè)務(wù)需求書(shū),參加1次國(guó)際學(xué)術(shù)會(huì)議,即將參加國(guó)際學(xué)術(shù)會(huì)議5次。邀請(qǐng)美國(guó)加州大學(xué)圣塔芭芭拉分校嚴(yán)錫鋒教授到華中科技大學(xué)交流1次。
衛(wèi)星數(shù)據(jù)項(xiàng)目組成員到柬埔寨吳哥和前副首相以及柬埔寨相關(guān)技術(shù)人員交流遙感技術(shù)在柬埔寨的應(yīng)用。
項(xiàng)目組成員和前副首相座談
③ 成果宣傳推介情況
項(xiàng)目組成員受邀作為專(zhuān)欄作家在“觀察者網(wǎng)”上發(fā)表大量關(guān)于遙感空間信息應(yīng)用到全球社會(huì)經(jīng)濟(jì)分析的文章,平均每篇文章的閱讀量能達(dá)到5萬(wàn)。(觀察者網(wǎng)是上海春秋發(fā)展戰(zhàn)略研究院主辦的新聞時(shí)評(píng)集成網(wǎng)站,旨在以即時(shí)綜合資訊和特色原創(chuàng)內(nèi)容為全球中文閱讀者提供時(shí)政事件的深度報(bào)道以及思想領(lǐng)域的全面解讀。)
如利用遙感衛(wèi)星資料描述夏威夷火山爆發(fā)的文章《夏威夷人民處于水深火熱中 但美國(guó)政府的領(lǐng)土面積又?jǐn)U大了》僅僅在“今日頭條”一個(gè)渠道上就實(shí)現(xiàn)了一天63.5萬(wàn)的閱讀量,313條回帖評(píng)論的成績(jī)。
目前我們?cè)谥心习雿u的應(yīng)用主要以柬埔寨的暹粒市為核心,這里是柬埔寨第二大城市,也是著名世界自然遺產(chǎn)吳哥窟所在地。我們利用光學(xué)、雷達(dá)多種傳感器對(duì)其開(kāi)展研究分析。我們通過(guò)遙感衛(wèi)星數(shù)據(jù)對(duì)該區(qū)域土地類(lèi)型展開(kāi)分類(lèi),評(píng)估隨著經(jīng)濟(jì)的發(fā)展,其城市的變化趨勢(shì),以及其可持續(xù)發(fā)展的承載能力。
2017年柬埔寨暹粒市(吳哥)衛(wèi)星影像
2017年柬埔寨暹粒市(吳哥)土地分類(lèi)圖
④ 研究中存在的主要問(wèn)題、改進(jìn)措施,研究心得、意見(jiàn)建議
無(wú)
⑤ 其他需要說(shuō)明的問(wèn)題
4)子課題之四:基于云服務(wù)的數(shù)據(jù)可視化及數(shù)據(jù)庫(kù)多語(yǔ)言智能化應(yīng)用
本子課題旨在解決中國(guó)—中南半島經(jīng)濟(jì)走廊沿線綜合數(shù)據(jù)庫(kù)的數(shù)據(jù)可視化、多語(yǔ)言翻譯、智能化應(yīng)用—金融數(shù)據(jù)平臺(tái)三個(gè)問(wèn)題。
數(shù)據(jù)可視化:(已完成)
在基于云服務(wù)的數(shù)據(jù)可視化方法研究基礎(chǔ)上,研究建立了中國(guó)—中南半島經(jīng)濟(jì)走廊空間數(shù)據(jù)可視化多維度展示系統(tǒng),實(shí)現(xiàn)了區(qū)域遙感影像、矢量數(shù)據(jù)、圖片、視頻、新聞文字等大規(guī)模結(jié)構(gòu)化、半結(jié)構(gòu)化、非結(jié)構(gòu)化多源異構(gòu)數(shù)據(jù)的高效可視化。
東盟國(guó)家相關(guān)數(shù)據(jù)展示
多語(yǔ)言翻譯:(已完成軟件需求分析)
對(duì)海量東盟多語(yǔ)種信息的詞匯同中文的詞匯、語(yǔ)句進(jìn)行云平臺(tái)后臺(tái)對(duì)應(yīng),并設(shè)計(jì)相應(yīng)算法對(duì)相應(yīng)語(yǔ)法進(jìn)行準(zhǔn)確翻譯。
數(shù)據(jù)智能化應(yīng)用:這是一個(gè)開(kāi)放共享數(shù)據(jù)庫(kù)數(shù)據(jù)的平臺(tái)。(已完成軟件需求分析)
研究數(shù)據(jù)接口,建立起相關(guān)金融數(shù)據(jù)平臺(tái)實(shí)現(xiàn)支持東盟金融信息、實(shí)時(shí)行情數(shù)據(jù)、金融資訊等內(nèi)容的編輯、加工和整合的加工處理系統(tǒng),形成東盟金融數(shù)據(jù)中心和編輯中心。
進(jìn)展:
1.調(diào)研了東盟國(guó)家金融數(shù)據(jù)相關(guān)情況
調(diào)研了解了國(guó)內(nèi)外現(xiàn)有金融數(shù)據(jù)平臺(tái):有世界銀行網(wǎng)站、雅虎財(cái)經(jīng)、新浪財(cái)經(jīng)、中國(guó)金融信息網(wǎng)、東方財(cái)富網(wǎng)、中國(guó)金融指數(shù)研究院、搜狐等。通過(guò)對(duì)各大金融網(wǎng)站數(shù)據(jù)匯總對(duì)比,分析了目前國(guó)內(nèi)外現(xiàn)有金融數(shù)據(jù)平臺(tái)的金融數(shù)據(jù)信息,對(duì)后續(xù)金融數(shù)據(jù)的采集提供相關(guān)參考。
2.研究和分析金融數(shù)據(jù)的采集及處理
金融數(shù)據(jù)根據(jù)時(shí)效性,一般分為實(shí)時(shí)變動(dòng)的數(shù)據(jù)和非實(shí)時(shí)變動(dòng)的數(shù)據(jù)。已按不同要求收集獲取了網(wǎng)絡(luò)金融數(shù)據(jù)。針對(duì)東盟各國(guó)的金融數(shù)據(jù)情況,對(duì)于實(shí)時(shí)變動(dòng)的數(shù)據(jù),實(shí)現(xiàn)實(shí)時(shí)、不間斷的獲取相關(guān)數(shù)據(jù);對(duì)于階段性的統(tǒng)計(jì)數(shù)據(jù),按照固定時(shí)間間隔監(jiān)控一次數(shù)據(jù)來(lái)源網(wǎng)站,獲取相關(guān)金融數(shù)據(jù)。
②調(diào)查研究及學(xué)術(shù)交流情況(調(diào)研數(shù)據(jù)整理運(yùn)用、文獻(xiàn)資料收集整理、學(xué)術(shù)會(huì)議、學(xué)術(shù)交流、國(guó)際合作等)
調(diào)研了解了國(guó)內(nèi)外現(xiàn)有金融數(shù)據(jù)平臺(tái),對(duì)各種金融數(shù)據(jù)按照結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù);行情數(shù)據(jù)、宏觀經(jīng)濟(jì)數(shù)據(jù)、行業(yè)產(chǎn)業(yè)數(shù)據(jù)等進(jìn)行整理、歸類(lèi)。
撰寫(xiě)整理了兩份報(bào)告:東盟金融信息平臺(tái)系統(tǒng)需求研究報(bào)告一份,東盟金融信息平臺(tái)系統(tǒng)需求設(shè)計(jì)分析一份
③成果宣傳推介情況(成果發(fā)布會(huì)、《工作簡(jiǎn)報(bào)》報(bào)送情況、國(guó)家社科基金專(zhuān)刊投稿及采用情況等);
無(wú)
④研究中存在的主要問(wèn)題、改進(jìn)措施,研究心得、意見(jiàn)建議
存在的主要問(wèn)題:金融數(shù)據(jù)調(diào)研前期數(shù)據(jù)較多,數(shù)據(jù)指標(biāo)較雜亂。
改進(jìn)措施:向金融專(zhuān)業(yè)的教授專(zhuān)家請(qǐng)教,提取重要金融數(shù)據(jù),重新設(shè)計(jì)優(yōu)化相關(guān)數(shù)據(jù)結(jié)構(gòu),對(duì)金融數(shù)據(jù)重新歸類(lèi)。
研究心得:要充分準(zhǔn)備,目標(biāo)明確;加強(qiáng)團(tuán)隊(duì)合作與交流;不斷反思與借鑒,提高科研能力。
二、研究成果情況
項(xiàng)目組已經(jīng)取得的代表性成果
1)中國(guó)-東盟全息數(shù)據(jù)研究與資訊中心建設(shè)
中國(guó)-東盟研究院的全息數(shù)據(jù)研究與資訊中心,也是中國(guó)-東盟信息港的數(shù)據(jù)中心先行先試,該中心除了具有完善的設(shè)備外,還研發(fā)了一套東盟全息數(shù)據(jù)系統(tǒng)平臺(tái),該系統(tǒng)平臺(tái)能極大滿(mǎn)足科研團(tuán)隊(duì)課題研究需要,為日常教學(xué)工作、為各類(lèi)專(zhuān)題會(huì)議、為社會(huì)各界了解東盟各國(guó)相關(guān)信息提供技術(shù)支撐,助力廣西大學(xué)中國(guó)-東盟研究院打造“中國(guó)-東盟”領(lǐng)域國(guó)家級(jí)智庫(kù),為中國(guó)-東盟合作進(jìn)程做出應(yīng)有貢獻(xiàn)。
2)資訊中心機(jī)房建設(shè)
(1)系統(tǒng)規(guī)模
(2)系統(tǒng)物理拓?fù)鋱D
3)領(lǐng)導(dǎo)批示及建議采納。
對(duì)運(yùn)行于上述配置的機(jī)房中的系統(tǒng)采集得到的大數(shù)據(jù)進(jìn)行研究,2017、2018兩年有10份研究成果分別得到自治區(qū)黨委書(shū)記、主席等各級(jí)領(lǐng)導(dǎo)批示、進(jìn)入教育部成果簡(jiǎn)報(bào)等,為政府決策提供有力支持。
。
4)實(shí)時(shí)獲取全球熱點(diǎn)新聞、新聞分布圖等各類(lèi)信息
5)以采集數(shù)據(jù)為基礎(chǔ),生成了廣西大學(xué)東盟研究院的輿情周報(bào)、國(guó)別輿情報(bào)告、專(zhuān)題輿情報(bào)告、熱點(diǎn)分析等諸多成果。
廣西大學(xué)中國(guó)東盟研究院輿情報(bào)告以中國(guó)—東盟領(lǐng)域?qū)崟r(shí)新聞和重大熱點(diǎn)問(wèn)題為關(guān)注重點(diǎn),分為國(guó)別輿情、專(zhuān)題輿情、熱點(diǎn)分析和輿情報(bào)告滾動(dòng)四個(gè)板塊內(nèi)容,將相關(guān)輿情信息編制成定期專(zhuān)報(bào),對(duì)某一重大輿情事件提供階段性或全過(guò)程輿情監(jiān)測(cè)與分析研判,為廣大研究者和研究機(jī)構(gòu)提供形式多樣、視角豐富的中國(guó)—東盟主流訊息。
國(guó)別輿情報(bào)告以東盟十國(guó)為研究對(duì)象,由廣西大學(xué)中國(guó)東盟研究院十個(gè)國(guó)別研究所提供,包括《越南所輿情周報(bào)》、《緬甸輿情周報(bào)》、《老撾輿情周報(bào)》、《柬埔寨輿情周報(bào)》、《印度尼西亞輿情周報(bào)》、《新加坡輿情周報(bào)》、《菲律賓輿情周報(bào)》、《馬來(lái)西亞輿情周報(bào)》、《泰國(guó)輿情周報(bào)》、《文萊輿情周報(bào)》。同時(shí),在匯集國(guó)別輿情報(bào)告的基礎(chǔ)上,經(jīng)由整理、匯編,形成《東盟輿情政治周刊》、《東盟輿情經(jīng)濟(jì)周刊》、《東盟輿情社會(huì)周刊》。
通過(guò)廣西大學(xué)中國(guó)東盟研究院官網(wǎng)、政府媒體、知名媒體網(wǎng)站和通訊社等途徑對(duì)東盟十國(guó)的輿論信息和重大新聞進(jìn)行實(shí)時(shí)的采集,匯總和分析,編制成定期周報(bào),為中國(guó)—東盟領(lǐng)域的全方位研究提供及時(shí)有效的信息與資料。
專(zhuān)題輿情報(bào)告包括《ASEAN周報(bào)》、《中國(guó)—東盟設(shè)施聯(lián)通輿情半月談》、《TPP、APEC、RCEP、FTAAP、TTIP輿情半月談》、《中國(guó)—東盟金融輿情半月談》、《中國(guó)—東盟人文輿情半月談》、《中國(guó)—東盟投資與貿(mào)易輿情半月談》、《中國(guó)—東盟一帶一路輿情半月談》、《中國(guó)廣西—東盟關(guān)系輿情半月談》。
專(zhuān)題輿情以?xún)?nèi)容專(zhuān)題的形式對(duì)中國(guó)-東盟的重大事件進(jìn)行匯總分析和解讀點(diǎn)評(píng),精準(zhǔn)呈現(xiàn)媒體關(guān)注熱點(diǎn),及時(shí)捕捉重大事件輿情動(dòng)向,為中國(guó)-東盟領(lǐng)域研究帶來(lái)針對(duì)性的參考借鑒。
“熱點(diǎn)分析”如下圖:
“輿情報(bào)告滾動(dòng)”如下圖:
6)數(shù)據(jù)挖掘子系統(tǒng)成果
(1) FRFB:基于關(guān)注行為預(yù)測(cè)的關(guān)注對(duì)象推薦方法
近年來(lái)隨著微博等社交網(wǎng)絡(luò)的快速增長(zhǎng),基于社交網(wǎng)絡(luò)圖結(jié)構(gòu)分析的一個(gè)新的具有重要意義的課題是用戶(hù)關(guān)注對(duì)象(followee)的推薦問(wèn)題。國(guó)內(nèi)外已有不少關(guān)注對(duì)象推薦的相關(guān)研究,但如何將基于圖拓?fù)浣Y(jié)構(gòu)和基于內(nèi)容的方法有效結(jié)合起來(lái)仍是一個(gè)很大的挑戰(zhàn)。通過(guò)探索和利用社交網(wǎng)絡(luò)圖結(jié)構(gòu)中用戶(hù)“關(guān)注”行為的拓?fù)鋫鞑ヌ匦裕扑]潛在的關(guān)注對(duì)象。探索了一種利用用戶(hù)“關(guān)注”行為本身來(lái)預(yù)測(cè)用戶(hù)“關(guān)注”行為的新思路:將用戶(hù)對(duì)其他用戶(hù)的“關(guān)注”視作一個(gè)主動(dòng)的、動(dòng)態(tài)的、連貫的用戶(hù)行為,進(jìn)一步考慮用戶(hù)“關(guān)注”行為之間的相互影響,并結(jié)合作者前期對(duì)top-k選擇算法的研究,提出一種有效的top-k關(guān)注對(duì)象推薦算法FRFB (Followee Recommendation by Following Behaviors)。FRFB基于社交網(wǎng)絡(luò)圖結(jié)構(gòu)本身,借鑒朋友關(guān)系在社交網(wǎng)絡(luò)中的傳播思想,對(duì)關(guān)注關(guān)系的傳播進(jìn)行建模。算法復(fù)雜度低,可擴(kuò)展性高,并且稍加調(diào)整即可適應(yīng)現(xiàn)實(shí)中大規(guī)模動(dòng)態(tài)社交網(wǎng)絡(luò)。在真實(shí)社交網(wǎng)絡(luò)數(shù)據(jù)集(Wiki和Twitter)上進(jìn)行的大量實(shí)驗(yàn)表明,F(xiàn)RFB算法的推薦性能顯著優(yōu)于已有的基于圖拓?fù)浣Y(jié)構(gòu)的推薦算法。
論文成果“FRFB: Top-k Followee Recommendation by Exploring the Following Behaviors in Social Networks”發(fā)表在Concurrency and Computation-Practice & Experience(CCF C類(lèi)期刊)期刊2018.06發(fā)表(DOI: 10.1002/cpe.4514)。
(2) 一種基于話題排序的通用話題建?蚣
話題建模是文本數(shù)據(jù)挖掘的一種重要方法,本文研究文檔網(wǎng)絡(luò)的話題建模問(wèn)題,將話題排序與話題建模相結(jié)合,提出一種基于話題排序的通用話題建?蚣躌TMF(Rank-Integrated Topic Modeling Framework),解決了當(dāng)前基于排序的話題建模不能與LDA相結(jié)合的問(wèn)題。RTMF將排序向量進(jìn)行話題歸一化,然后通過(guò)一個(gè)權(quán)重因子將排序向量引入話題建模中,建立了一個(gè)話題排序與話題建;ハ嘣鰪(qiáng)的框架。在RTMF的基礎(chǔ)上,本文提出基于話題排序的PLSA模型和LDA模型。具體來(lái)說(shuō),將Topical PageRank和Topical HITS分別與PLSA模型相結(jié)合建立RankPLSA和HITSPLSA模型并推導(dǎo)出基于EM的模型推理算法,將Topical PageRank和Topical HITS分別與LDA模型相結(jié)合建立RankLDA和HITSLDA模型,推導(dǎo)出基于折疊吉布斯采樣的模型推理算法。
實(shí)驗(yàn)在三個(gè)論文數(shù)據(jù)集和一個(gè)Twitter數(shù)據(jù)集上進(jìn)行,對(duì)比算法包括兩個(gè)基礎(chǔ)的話題模型和兩個(gè)基于排序的話題模型,對(duì)比實(shí)驗(yàn)包括泛化能力、文檔分類(lèi)、文檔聚類(lèi)和話題可解釋性四個(gè)方面。實(shí)驗(yàn)結(jié)果顯示本文所提出的四個(gè)基于話題排序的話題模型在所有對(duì)比實(shí)驗(yàn)上均優(yōu)于基礎(chǔ)的話題模型,基于話題排序的LDA模型在所有模型中具有最好的效果;谠掝}排序的通用話題建?蚣芸捎糜诨跀(shù)字媒體的熱點(diǎn)事件分析等。
論文成果“Rank-Integrated Topic Modeling: A General Framework”被APWeb-WAIM2018錄用發(fā)表(CCF C類(lèi)會(huì)議)。
(3) 基于時(shí)間卷積和長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)的時(shí)間序列預(yù)測(cè)模型
時(shí)間序列預(yù)測(cè)一直以來(lái)就是學(xué)者們研究的熱門(mén)領(lǐng)域,提出來(lái)一系列優(yōu)秀的模型算法,例如ARIMA,Holt-Winters等;深度學(xué)習(xí)興起后,各種處理序列數(shù)據(jù)的模型不斷出現(xiàn),出現(xiàn)了一大批以RNN為基礎(chǔ)的模型的創(chuàng)新,例如LSTM,GRU等,本文從發(fā)掘時(shí)間序列的長(zhǎng)期模式和短期的波動(dòng)規(guī)律兩個(gè)方面出發(fā),受卷積神經(jīng)網(wǎng)絡(luò)提取區(qū)域特征的啟發(fā),使用時(shí)間卷積提取序列的長(zhǎng)期波動(dòng)特征,然后將其整合到LSTM的細(xì)胞狀態(tài)中,因此循環(huán)神經(jīng)網(wǎng)絡(luò)可以獲得更長(zhǎng)的數(shù)據(jù)依賴(lài)性并同時(shí)獲得整體變化特征的時(shí)間序列預(yù)測(cè)模型。本文提出一種基于時(shí)間卷積和長(zhǎng)期短期記憶網(wǎng)絡(luò)(TC-LSTM)的新型深度學(xué)習(xí)模型,以捕獲長(zhǎng)期系列特征以進(jìn)行時(shí)間序列的長(zhǎng)期和短期預(yù)測(cè)。本文在三個(gè)不同類(lèi)型的數(shù)據(jù)集上對(duì)TC-LSTM模型進(jìn)行實(shí)驗(yàn),相比于傳統(tǒng)的LSTM和GRU網(wǎng)絡(luò),實(shí)驗(yàn)結(jié)果表明,TC-LSTM模型在預(yù)測(cè)精度上優(yōu)于其他類(lèi)似模型,結(jié)合實(shí)驗(yàn)結(jié)果和模型分析,加入時(shí)間卷積特征對(duì)于時(shí)間序列預(yù)測(cè)精度有一定的提升。
論文成果“Stock Price Prediction Using Time Convolution Long Short-Term Memory Network”已被KSEM 2018(CCF C類(lèi)會(huì)議)錄用。
(4) 融合微博情感分析和深度學(xué)習(xí)的宏觀經(jīng)濟(jì)預(yù)測(cè)方法研究
現(xiàn)代市場(chǎng)經(jīng)濟(jì)快速發(fā)展的同時(shí)也伴隨著較高的風(fēng)險(xiǎn)。本文通過(guò)對(duì)地區(qū)投資情況提前預(yù)測(cè),以求能夠提前發(fā)現(xiàn)投資風(fēng)險(xiǎn),為國(guó)家、企業(yè)的投資決策提供參考。針對(duì)宏觀經(jīng)濟(jì)預(yù)測(cè)中統(tǒng)計(jì)數(shù)據(jù)滯后和內(nèi)部關(guān)系復(fù)雜的問(wèn)題,本文提出一種融合情感分析和深度學(xué)習(xí)的預(yù)測(cè)方法——SA-LSTM(Sentiment Analysis-Long Short Term Memory)。該方法首先考慮微博的強(qiáng)時(shí)效性,確定了微博爬取和情感分析的方法,得到微博情感分值,進(jìn)而結(jié)合政府統(tǒng)計(jì)的結(jié)構(gòu)化經(jīng)濟(jì)指標(biāo)和長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)地區(qū)投資總額預(yù)測(cè)。經(jīng)過(guò)實(shí)際數(shù)據(jù)計(jì)算驗(yàn)證,在三個(gè)數(shù)據(jù)集上,加入微博后,該方法能夠降低預(yù)測(cè)相對(duì)誤差4.95%, 0.92%, 1.21%;與差分自回歸移動(dòng)平均模型(Autoregressive Integrated Moving Average Model, ARIMA), 線性回歸(Linear Regression, LR),反向傳播(Back Propagation, BP)神經(jīng)網(wǎng)絡(luò), 長(zhǎng)短期記憶(Long Short Term Memory, LSTM)網(wǎng)絡(luò)四個(gè)方法中的最優(yōu)方法相比能夠降低相對(duì)誤差0.06%, 2.09%, 0.94%。另外,該方法在多個(gè)時(shí)間片上,預(yù)測(cè)相對(duì)誤差穩(wěn)定,具有很好的魯棒性,對(duì)數(shù)據(jù)抖動(dòng)有良好的適應(yīng)性。
論文成果《融合微博情感分析和深度學(xué)習(xí)的宏觀經(jīng)濟(jì)預(yù)測(cè)方法》已被CCDM 2018錄用,推薦到《計(jì)算機(jī)應(yīng)用》期刊發(fā)表。
(5)基于遠(yuǎn)域適應(yīng)的文本分類(lèi)
文本分類(lèi)現(xiàn)在成為了一個(gè)熱點(diǎn)話題。在實(shí)際中,訓(xùn)練數(shù)據(jù)跟測(cè)試數(shù)據(jù)很可能來(lái)自不同的分布,這就導(dǎo)致了域適應(yīng)問(wèn)題。在本文中,我們研究一個(gè)新的問(wèn)題:文本的遠(yuǎn)域適應(yīng)分類(lèi)問(wèn)題。在這個(gè)問(wèn)題中,目標(biāo)域跟源域可能差別很大,傳統(tǒng)的遷移學(xué)習(xí)方法并不能很好的處理這類(lèi)問(wèn)題,因?yàn)樗麄兗僭O(shè)源域和目標(biāo)域是相似的。為了解決這個(gè)問(wèn)題,我們提出了基于選擇的域適應(yīng)算法;谶x擇的域適應(yīng)算法從源域和中間域中迭代選擇可靠的數(shù)據(jù),來(lái)減少源域和目標(biāo)域之間的差異。大量的實(shí)驗(yàn)表明,我們的算法能取得最好的效果。
論文成果“Distant Domain Adaptation for Text Classification ”已被KSEM 2018錄用。
(6)話題權(quán)威度敏感的影響最大化
影響力最大化(Influence Maximization,IM)已經(jīng)在社會(huì)網(wǎng)絡(luò)分析中被廣泛的研究,但大部分現(xiàn)有的研究無(wú)法區(qū)分不同消息下的影響力用戶(hù)及用戶(hù)權(quán)威度,針對(duì)現(xiàn)有傳播模型和算法的不足,通過(guò)將用戶(hù)的主題權(quán)威度融入到傳播模型中,提出了主題權(quán)威度敏感的獨(dú)立級(jí)聯(lián)模型(Topical Authority sensitive Independent Cascade model,TAIC),同時(shí),為了解決主題權(quán)威度敏感的IM問(wèn)題,將上述模型與貪心算法結(jié)合,提出了主題權(quán)威度敏感的貪心算法(Topical Authority sensitive Greedy algorithm,TAG)。由于傳統(tǒng)的評(píng)價(jià)度量并沒(méi)有考慮主題,提出了新的度量 ,用于評(píng)估考慮了主題的傳播模型和算法的有效性。通過(guò)在兩個(gè)真實(shí)的社會(huì)網(wǎng)絡(luò)數(shù)據(jù)集Aminer和NetHEPT上的實(shí)驗(yàn)表明,基于TAIC模型的TAG算法以非常高的效率分別找到在給定主題下影響力更大的種子節(jié)點(diǎn)集。
論文成果“Topical Authority-Sensitive Influence Maximization”已被WISE2018 錄用。
(7) PTS-Dep:用于云存儲(chǔ)的一套高性能兩方去重方法
盡管消息綁定加密方法能夠使得安全去重技術(shù)成為可能,但是基于低熵的窮舉攻擊也隨之成為安全去重技術(shù)的所面臨安全風(fēng)險(xiǎn)之一。傳統(tǒng)的方法通過(guò)引入可信第三方,試圖防止窮舉攻擊。然而傳統(tǒng)的去重技術(shù)均是運(yùn)用于兩方場(chǎng)景(只包含客戶(hù)端和服務(wù)端),因此該方法難以被廣泛應(yīng)用于實(shí)際場(chǎng)景中。出于部署復(fù)雜性的考慮,現(xiàn)有的存儲(chǔ)服務(wù)提供商更加傾向于兩方場(chǎng)景下的安全去重技術(shù)。但是,現(xiàn)有的兩方安全去重研究中存在性能較差或安全漏洞的問(wèn)題。為了使得兩方安全去重技術(shù)既能夠獲得較好的系統(tǒng)性能,同時(shí)能夠抵制兩方場(chǎng)景下的安全威脅,本文通過(guò)總結(jié)現(xiàn)有安全去重的核心問(wèn)題,針對(duì)性的提出一套高性能兩方去重方法,PTS-Dep。通過(guò)理論推導(dǎo)對(duì)我們的方法進(jìn)行了安全證明。實(shí)驗(yàn)結(jié)果表明我們的方法在Fslhome數(shù)據(jù)集上,比現(xiàn)有的兩方安全去重方法提高了92%的性能。
論文成果“PTS-Dep:A High-Performance Two-party Secure Deduplication for Cloud Storage”被The 20th IEEE International Conference on High Performance Computing and Communications (HPCC-2018,CCF C類(lèi)會(huì)議)錄用。
7)完成東盟金融信息平臺(tái)、云翻譯數(shù)據(jù)中心等系統(tǒng)需求研究報(bào)告及信息平臺(tái)系統(tǒng)需求設(shè)計(jì)分析
研究成果可有針對(duì)性的提供中南半島各國(guó)各類(lèi)數(shù)據(jù),為中國(guó)和中南半島各國(guó)的經(jīng)濟(jì)合作提供技術(shù)支持和服務(wù)。這將有助于把中國(guó)的發(fā)展戰(zhàn)略與中南半島各國(guó)發(fā)展藍(lán)圖對(duì)接,同中南半島各國(guó)的項(xiàng)目和企業(yè)對(duì)接,以及與中南半島各國(guó)的雙多邊合作機(jī)制和平臺(tái)對(duì)接,推進(jìn)國(guó)際合作,服務(wù)于“一帶一路”建設(shè)。
8)數(shù)據(jù)庫(kù)安全系統(tǒng)
通過(guò)動(dòng)態(tài)配置方式實(shí)現(xiàn)對(duì)主流數(shù)據(jù)庫(kù)中數(shù)據(jù)進(jìn)行動(dòng)態(tài)加密,無(wú)需更改用戶(hù)程序。數(shù)據(jù)以密文方式存儲(chǔ)于數(shù)據(jù)庫(kù)中,防止了數(shù)據(jù)被非法用戶(hù)使用,保障了數(shù)據(jù)安全。
9)終端安全系統(tǒng)
通過(guò)對(duì)客戶(hù)端各類(lèi)操作授權(quán),數(shù)據(jù)硬件、軟件加密等各種控制方式,實(shí)現(xiàn)數(shù)據(jù)庫(kù)外數(shù)據(jù)安全保障。
三、下一步研究計(jì)劃
1 人物影響力分析:
Rashotte根據(jù)用戶(hù)行為以及其產(chǎn)生的效果,將社交影響力定義為人們由于和其他人或團(tuán)體之間的交互而改變自身思想,感情,態(tài)度和行為的現(xiàn)象。社交影響力的定義具有明顯的因果性。影響用戶(hù)的社交影響力的因素主要有:現(xiàn)實(shí)生活中的地位,活躍程度,價(jià)值觀。反映社交影響力的因素主要有以下三個(gè):(1) 社交網(wǎng)絡(luò)結(jié)構(gòu) (2) 社交網(wǎng)絡(luò)用戶(hù)之間的交互活動(dòng) (3) 社交網(wǎng)絡(luò)用戶(hù)所發(fā)布的信息。
社交網(wǎng)絡(luò)的結(jié)構(gòu)因素主要為用戶(hù)和用戶(hù)之間的連接形成的網(wǎng)絡(luò)圖。網(wǎng)絡(luò)圖中的節(jié)點(diǎn)的入度和出度,以及入向和出向的邊指向的節(jié)點(diǎn)的影響力都反映著節(jié)點(diǎn)用戶(hù)本身的影響力。顯而易見(jiàn)的是:用戶(hù)的粉絲越多,越有影響力,那么用戶(hù)就更有影響。社交網(wǎng)路中用戶(hù)的交互活動(dòng)體現(xiàn)在:回復(fù),轉(zhuǎn)發(fā),收藏等活動(dòng)上,用戶(hù)的不同活動(dòng)反映了用戶(hù)之間的親密程度。社交網(wǎng)絡(luò)中用戶(hù)所發(fā)布的信息體現(xiàn)了用戶(hù)的專(zhuān)長(zhǎng)信息。不同的政要可能分管不同的工作,擅長(zhǎng)不同的領(lǐng)域(比如政治,歷史,外交……)。在社交活動(dòng)中,信息往往是以話題的形式產(chǎn)生和傳播的。信息可能側(cè)重于不同的話題,這就造成了不同的話題具有不同的影響力。將話題作為刻畫(huà)影響力的因素,能夠從多個(gè)角度對(duì)用戶(hù)的影響力進(jìn)行細(xì)致刻畫(huà),在建立社交影響力模型時(shí),可以直接從話題內(nèi)容和用戶(hù)對(duì)話題的參與程度構(gòu)建用戶(hù)和話題之間的聯(lián)系。
社交網(wǎng)路結(jié)構(gòu)的,用戶(hù)活動(dòng),以及話題信息三個(gè)因素從不同的角度對(duì)用戶(hù)的社交影響力進(jìn)行了刻畫(huà)。話題信息,用戶(hù)活動(dòng)信息反映了用戶(hù)在某一話題的特征。社交網(wǎng)絡(luò)結(jié)構(gòu)反映了用戶(hù)之間邊的特征。因此可以將上述的影響因素抽象為用戶(hù)的特征函數(shù)g, 邊的特征函數(shù)f,以及全局的特征函數(shù)h。綜合利用三個(gè)特征函數(shù)對(duì)用戶(hù)的不同影響力進(jìn)行刻畫(huà)能夠更加準(zhǔn)確的反映用戶(hù)的影響力。
話題因子圖模型(Topical Factor Graph (TFG) Model)根據(jù)三個(gè)特征函數(shù)對(duì)社交網(wǎng)路影響力分析進(jìn)行建模。因此TFG模型有效地捕獲了地話題信息,節(jié)點(diǎn)的相似度,以及網(wǎng)絡(luò)結(jié)構(gòu)的信息。TFG模型包含了一個(gè)觀察變量 的集合,以及一個(gè)隱含變量的集合。 集合。隱含變量y在話題層面上刻畫(huà)了其他節(jié)點(diǎn)對(duì)節(jié)點(diǎn) 的影響力。TFG模型圖如下圖所示:
圖2 話題因子圖模型
上圖是TFG模型的實(shí)例,途中包含了觀察變量 ,以及相對(duì)應(yīng)的隱含向量 , 隱含節(jié)點(diǎn)之間的邊表明了在原有社交網(wǎng)絡(luò)中的社交關(guān)系。節(jié)點(diǎn)對(duì)應(yīng)的特征函數(shù)g描述了節(jié)點(diǎn)本地的信息,邊的特征函數(shù)f描述了圖模型中通過(guò)邊引起的節(jié)點(diǎn)之間的依賴(lài)關(guān)系,全局特征函數(shù)描述了對(duì)于網(wǎng)絡(luò)中所有節(jié)點(diǎn)的約束。特征函數(shù)的定義如下:
式中NB(i)代表了節(jié)點(diǎn)i的鄰居節(jié)點(diǎn), 反映了節(jié)點(diǎn) 和節(jié)點(diǎn) 之間的話題相似性和交互強(qiáng)度, 代表了節(jié)點(diǎn) 對(duì)于話題z的重要性, 表示邊 的權(quán)重。在該應(yīng)用中,其表示用戶(hù)之間的交互活躍度。
邊的特征函數(shù)定義為節(jié)點(diǎn)之間是否存在依賴(lài),即當(dāng)邊 存在時(shí), 。全局特征函數(shù)如下:
全局特征函數(shù)用于約束模型能夠真正的代表節(jié)點(diǎn)。
當(dāng)模型能夠最好的擬合觀察到的數(shù)據(jù)時(shí),其能夠最大化觀察到數(shù)據(jù)的概率,即:
參數(shù)學(xué)習(xí)
TFG模型的參數(shù)學(xué)習(xí)過(guò)程,可以通過(guò)對(duì)每條邊引入兩個(gè)變量集合 和 ,將普通的因子圖消息傳遞方法轉(zhuǎn)化為max-sum算法。 表示從節(jié)點(diǎn)i到節(jié)點(diǎn)j發(fā)送的消息。 表示從節(jié)點(diǎn)j到節(jié)點(diǎn)i發(fā)送的消息。 反映了從節(jié)點(diǎn) 的角度, 認(rèn)為其受 影響的程度。 反映了從節(jié)點(diǎn) 的角度, 認(rèn)為其影響 的程度。消息更新規(guī)則如下:
其中 是對(duì)歸一化的特征函數(shù)取log值得到的,
最后,社會(huì)影響力定義為:
2 投資環(huán)境分析子系統(tǒng)的指標(biāo)庫(kù)管理、模型庫(kù)管理、運(yùn)行監(jiān)測(cè)、現(xiàn)狀評(píng)價(jià)等模塊研究與開(kāi)發(fā)
1.指標(biāo)庫(kù)管理:在已有的系統(tǒng)數(shù)據(jù)中,選擇與投資環(huán)境相關(guān)的多種指標(biāo)進(jìn)行分類(lèi)和管理,指標(biāo)分為監(jiān)測(cè)類(lèi)指標(biāo)、預(yù)測(cè)預(yù)警類(lèi)、評(píng)價(jià)類(lèi)指標(biāo),檢測(cè)類(lèi)指標(biāo)主要是對(duì)這些指標(biāo)進(jìn)行統(tǒng)計(jì)分析,預(yù)測(cè)類(lèi)指標(biāo)要對(duì)這些指標(biāo)進(jìn)行預(yù)測(cè)分析和預(yù)警,對(duì)于預(yù)警指標(biāo)要給出預(yù)警閾值,評(píng)價(jià)類(lèi)指標(biāo)用于現(xiàn)狀評(píng)價(jià)。同時(shí)指標(biāo)按宏觀分析、微觀分析、按專(zhuān)業(yè)方向等分類(lèi),各類(lèi)指標(biāo)的選擇確定基于運(yùn)行監(jiān)測(cè)和現(xiàn)狀評(píng)價(jià)的需求和指標(biāo)體系的設(shè)計(jì)。指標(biāo)庫(kù)的管理將使用MySQL關(guān)系型數(shù)據(jù)庫(kù),同時(shí)可以對(duì)指標(biāo)數(shù)據(jù)庫(kù)進(jìn)行增、刪、改、查操作。
2.模型庫(kù)管理:模型庫(kù)的管理與指標(biāo)庫(kù)的管理是類(lèi)似的,模型庫(kù)主要管理系統(tǒng)所需的分析、預(yù)測(cè)、預(yù)警模型,同時(shí)將模型進(jìn)行管理,模型包括輸入輸出和參數(shù)調(diào)整等,可以對(duì)模型進(jìn)行增、刪、改、查功能,完善預(yù)測(cè)預(yù)警模型體系。
3.運(yùn)行監(jiān)測(cè):在完善指標(biāo)庫(kù)的基礎(chǔ)上進(jìn)投資環(huán)境的運(yùn)行監(jiān)測(cè),包括檢測(cè)指標(biāo)的多維分析、進(jìn)行趨勢(shì)分析和相關(guān)指標(biāo)的預(yù)警。
經(jīng)濟(jì)運(yùn)行監(jiān)測(cè)分析是對(duì)經(jīng)濟(jì)運(yùn)行動(dòng)態(tài)指標(biāo)進(jìn)行的連續(xù)性觀測(cè)及其規(guī)律性的揭示,是經(jīng)經(jīng)濟(jì)運(yùn)行監(jiān)測(cè)分析不同于一般的統(tǒng)計(jì)分析。統(tǒng)計(jì)分析把數(shù)據(jù)的準(zhǔn)確及時(shí)作為主要目標(biāo),而經(jīng)濟(jì)運(yùn)行監(jiān)測(cè)分析除對(duì)數(shù)據(jù)的嚴(yán)格要求外,更加著重于對(duì)動(dòng)態(tài)和情況的把握,并把對(duì)經(jīng)濟(jì)運(yùn)行工作進(jìn)行指導(dǎo)作為主要目標(biāo)。確定經(jīng)濟(jì)運(yùn)行監(jiān)測(cè)分析的對(duì)象和內(nèi)容,同時(shí)分析其上下關(guān)聯(lián)、影響并制約發(fā)展的其他因素。在分析的基礎(chǔ)上進(jìn)行歸納,進(jìn)行經(jīng)濟(jì)運(yùn)行趨勢(shì)分析和預(yù)警。
在建立的數(shù)據(jù)倉(cāng)庫(kù)的基礎(chǔ)上,運(yùn)用多維分析技術(shù)對(duì)數(shù)據(jù)進(jìn)行分析。多維分析技術(shù)主要包括:數(shù)據(jù)庫(kù)和數(shù)據(jù)倉(cāng)庫(kù)技術(shù)(Data Warehousing)、數(shù)據(jù)抽取轉(zhuǎn)換加載技術(shù)(ETL-Extraction Transformation Loading)、聯(lián)機(jī)分析處理技術(shù)(OLAP-Online Analytical Process)、數(shù)據(jù)挖掘技術(shù)(Data Mining)、前端展現(xiàn)技術(shù)等。常見(jiàn)的多維分析操作主要有:鉆。ㄉ香@和下鉆)、切片、切塊、旋轉(zhuǎn)。鉆。恒@取是改變維度的層次,變換分析的粒度。鉆取包括上鉆和下鉆,上鉆是在某一維上將低層次的細(xì)節(jié)數(shù)據(jù)概括到高層次的匯總數(shù)據(jù)的過(guò)程,減少了分析的維數(shù);下鉆則是相反,它是將高層次的匯總數(shù)據(jù)進(jìn)行細(xì)化,深入到低層次細(xì)節(jié)數(shù)據(jù)的過(guò)程,增加了分析的維數(shù)。切片和切塊:在多維分析中,如果在某一維度上限定了一個(gè)值,則稱(chēng)為對(duì)原有分析的一個(gè)切片,如果對(duì)多個(gè)維度進(jìn)行限定,每個(gè)維度限定為一組取值范圍,則稱(chēng)為對(duì)原有分析的一個(gè)切塊。在多維分析中,維度都是按某一順序進(jìn)行顯示,如果變換維度 的順序和方向,或交換兩個(gè)維度的位置,則稱(chēng)為旋轉(zhuǎn)。多維分析的實(shí)現(xiàn)主要包括以下四點(diǎn),分別為:維度指標(biāo)的定義,建立維度指標(biāo)關(guān)聯(lián)關(guān)系,執(zhí)行維度和指標(biāo)查詢(xún),以及數(shù)據(jù)展現(xiàn)。在多維分析的基礎(chǔ)上,進(jìn)行歸納分析,繪制監(jiān)測(cè)指標(biāo)的運(yùn)行曲線,運(yùn)行趨勢(shì)分析。
例如對(duì)于產(chǎn)業(yè)園區(qū)可分別從經(jīng)濟(jì)環(huán)境分析、基礎(chǔ)設(shè)施建設(shè)及投資狀況、基礎(chǔ)產(chǎn)業(yè)發(fā)展研究分析、重點(diǎn)產(chǎn)業(yè)發(fā)展研究分析、主要重點(diǎn)企業(yè)經(jīng)營(yíng)分析、主要產(chǎn)業(yè)園區(qū)發(fā)展分析、重大項(xiàng)目建設(shè)分析、政策比較分析、投資吸引力分析、投資分析及前景、產(chǎn)業(yè)投融資策略分析幾個(gè)主題建立多維分析模型,進(jìn)行分析。
監(jiān)測(cè)預(yù)警以預(yù)警模型為基礎(chǔ)。預(yù)警預(yù)型可以采用多變量預(yù)警模型,多變量模型又可以分為靜態(tài)統(tǒng)計(jì)模型與模型庫(kù)。之后,根據(jù)檢測(cè)分析的需求,設(shè)計(jì)建立分主題的數(shù)據(jù)倉(cāng)庫(kù)和多維分析模型,可以對(duì)具體的指標(biāo)實(shí)行監(jiān)測(cè)預(yù)警。建立檢測(cè)模型,對(duì)指標(biāo)進(jìn)行檢測(cè),同時(shí)模型庫(kù)管理中錄入預(yù)警模型,在檢測(cè)的時(shí)候結(jié)合預(yù)警模型,在分析的基礎(chǔ)上進(jìn)行歸納,對(duì)指標(biāo)庫(kù)的某些指標(biāo)進(jìn)行預(yù)警,從而進(jìn)行經(jīng)濟(jì)運(yùn)型和動(dòng)態(tài)非統(tǒng)計(jì)模型。靜態(tài)統(tǒng)計(jì)模型如下:
① 線性判別模型。多元線性判別模型是運(yùn)用多元統(tǒng)計(jì)分析方法中的判別分析建立起來(lái)的,它是根據(jù)一定的樣本資料,建立判別函數(shù)、確定判定區(qū)域,以對(duì)指標(biāo)進(jìn)行監(jiān)測(cè)預(yù)警。
② 主成分預(yù)測(cè)模型。該模型也形成一個(gè)線性判定函數(shù)式,其形式類(lèi)似判別分析模型。不過(guò)該模型是運(yùn)用多元統(tǒng)計(jì)分析中的主成分分析方法,通過(guò)提煉綜合因子形成主成分,并利用主成分建立起來(lái)的。
③ 簡(jiǎn)單線性概率模型。該模型是利用多元線性回歸方法建立起來(lái)的,其形式是:y=c+β1x1+β2x2+…+βkxk。其中:c、β1、β2、…、βk為系數(shù);x1、x2、…、xk為 k個(gè)預(yù)測(cè)變量。
④ logit模型和probit模型。它們也分別叫作對(duì)數(shù)比率模型和概率單位模型,都屬于概率模型,是在克服簡(jiǎn)單的線性概率模型的基礎(chǔ)上并分別用logit 和probit概率函數(shù)建立起來(lái)的。logit模型的形式為:ln[p÷(1-p)]=α0+β1x1+β2x2+…+βkxk。其中:p取值為0、1; p為概率;x1,x2,…,xk為k個(gè)預(yù)測(cè)變量。
預(yù)警可以綜合多種預(yù)警模型,實(shí)現(xiàn)預(yù)警目標(biāo)。
4.現(xiàn)狀評(píng)價(jià):在已有的評(píng)價(jià)體系的基礎(chǔ)上,認(rèn)真分析當(dāng)前現(xiàn)狀評(píng)價(jià)的新需求,進(jìn)一步完善評(píng)價(jià)體系。同時(shí)綜合運(yùn)用主成分分析、聚類(lèi)分析、神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)等多方法融合,同時(shí)結(jié)合經(jīng)濟(jì)相關(guān)計(jì)量分析法形成復(fù)合型現(xiàn)狀評(píng)價(jià)模型,利用大數(shù)據(jù)分實(shí)現(xiàn)投資環(huán)境的現(xiàn)狀評(píng)價(jià)。
3、各系統(tǒng)開(kāi)發(fā)
1)“云翻譯數(shù)據(jù)中心”的軟件開(kāi)發(fā)
2)“生產(chǎn)線自動(dòng)控制子系統(tǒng)”的軟件開(kāi)發(fā)
3)“大數(shù)據(jù)應(yīng)用——城市建設(shè)和港口建設(shè)預(yù)測(cè)”的軟件開(kāi)發(fā)
4)“中國(guó)—中南半島經(jīng)濟(jì)走廊沿線國(guó)家金融平臺(tái)子系統(tǒng)”的軟件開(kāi)發(fā)
4、在完成上述1、2兩點(diǎn)分析的前提下,補(bǔ)充完善相關(guān)需求分析,并完成“數(shù)據(jù)挖掘——人物背景分析”的軟件開(kāi)發(fā)、“數(shù)據(jù)挖掘——投資環(huán)境分析”的軟件開(kāi)發(fā)
(課題組供稿)