K-对称-N算法的社交网络的隐私保护
作者:
高洁;肖基毅;向霞
期刊:
网络安全技术与应用 ,2017年(1):47,49 ISSN:1009-6833
作者机构:
南华大学计算机科学与技术学院 湖南 421001;[肖基毅; 向霞; 高洁] 南华大学
关键词:
k-对称匿名;社区结构;隐私保护
摘要:
针对k匿名算法在对抗结构攻击的不足,采用k-对称匿名算法对社会网络的隐私进行保护。本文对k-对称匿名算法进行可行性分析,并对其还原算法进行描述。虽然社会网络的隐私保护取得了大量的研究成果,社区结构的隐私保护也取得了很多成功,但是其成果都是彼此相对独立的,鲜有将二者兼顾。本文设计出一种k-对称-N匿名算法来解决此类问题。
语种:
中文
展开
基于RAE+Dropout相结合的微博情感分析
作者:
李坚;肖基毅;欧阳纯萍;阳小华;翟云
期刊:
情报工程 ,2017年3(6):44-53 ISSN:2095-915X
作者机构:
南华大学计算机科学与技术学院;[翟云] 国家行政学院;[肖基毅; 李坚; 欧阳纯萍; 阳小华] 南华大学
关键词:
情感分析;微博情感分析
摘要:
文本情感分析是近年自然语言处理领域的研究热点之一,其中微博情感分析受到了学术界和企业界的广泛关注。微博情感分析是指对用户针对某一事件发表的言论进行正向、负向和中性情感的判定。本文在分析了标准RAE模型缺点的基础上,提出了一种基于RAE+Dropout的联合模型。该模型利用Dropout技术有效地预防过拟合问题的发生,同时也提高了模型训练速度。RAE+Dropout模型与RAE+词性选择模型、标准RAE模型以及SVM模型的对比实验结果表明:RAE+Dropout模型的准确率和F1值属于最优,比标准RAE模型的准确值和F1值高出0.82%和0.64%,尤其是在高维词语向量中RAE+Dropout模型的效果更加明显。摘要
语种:
中文
展开
基于分型转折点的证券时间序列分段表示法
作者:
彭佳星;肖基毅
期刊:
商:经济与科技 ,2016年(31):195-196 ISSN:1006-0510
作者机构:
[彭佳星] 南华大学计算机科学与技术学院;[彭佳星] 衡阳师范学院计算机科学与技术学院;[彭佳星] 智能信息处理与应用湖南省重点实验室;[肖基毅] 南华大学
关键词:
分型;转折点;证券时间序列
摘要:
证券时间序列是证券交易价格的一组观测数据,是一种有其自身显著的特点的时间序列,针对这些特点我们提出一种基于分形理论与K线图形特点的分段方法,经过理论分析与实践证明其划分的证券时间序列分段有其合理性.在对时间序列数据压缩率很高的情况下,还能保持较好的拟合误差,并能较好地描述证券时间序列的走势特征.
语种:
中文
展开
基于用户特征的微博转发预测研究
作者:
仇学明;肖基毅;陈磊
期刊:
南华大学学报(自然科学版) ,2016年30(4):100-105 ISSN:1673-0062
作者机构:
南华大学 计算机科学与技术学院,湖南 衡阳,421001;[肖基毅; 陈磊; 仇学明] 南华大学
关键词:
微博;用户特征;转发;预测
摘要:
研究微博用户转发行为,预测微博转发概率,确定影响微博转发概率的因素,在热点挖掘、产品营销、舆情监控、谣言控制等方面有重要的现实意义.本文介绍了影响微博转发的用户特征,其中比较典型的有用户影响力、粉丝平均标签数、粉丝活跃度等特征.通过粉丝数-关注数算法、用户标签数算法、粉丝活跃度算法等分析了它们与微博转发之间的关联关系,并确定各个属性的阈值,这些阈值对微博转发预测起到了至关重要的作用.
语种:
中文
展开
离群点分析在高校能耗监控系统中的应用
作者:
徐琰;肖基毅
期刊:
南华大学学报(自然科学版) ,2014年(2):89-93 ISSN:1673-0062
作者机构:
南华大学 计算机科学与技术学院,湖南 衡阳,421001;[肖基毅; 徐琰] 南华大学
关键词:
节能;能耗监控;数据挖掘;离群点检测;卡方分布
摘要:
节能是当今社会面临的重大课题,高校作为能源大户以及教书育人的基地,必须在能耗监控系统中起到领先示范的作用。在节能分析系统中,能耗的预警预测是关键,因此,异常点的发现与分析,为预警提供了直接的依据,是整个系统的基础。在数据挖掘中,离群点检测分析可以通过多种方法实现,本文应用了基于统计分布的离群点检测方法,但由于在实际情况中,能耗数据的变化与社会各类群体的生活习性、工作周期相关,这些复杂性决定了在数据分析中,只能根据实际的业务来检验分析结果的正确性。本文通过对某高校的能耗进行基于统计分布的离群点分析,并结合校园能耗规律,得出在高校中能耗的异常情况并报警,以达到节约能耗的目的。
语种:
中文
展开
基于微博的用户社区网络挖掘分析
作者:
李佳;肖基毅;吴霖
期刊:
电脑知识与技术 ,2014年(16):3943-3947+3952 ISSN:1009-3044
作者机构:
南华大学计算机科学与技术学院,湖南衡阳,421000;[吴霖; 肖基毅; 李佳] 南华大学
关键词:
微博社区;用户关系;特征分析;关注推荐
摘要:
以新浪微博为研究平台,随机获取微博用户数据作为研究样本,通过共链关系构建社会网络,利用聚类分析方法对样本进行微博关注好友的网络群体分析,网络内部子结构分析和个体角色分析。进而从微博用户好友数据中挖掘关注对象的特征和关注对象间的关联特征,并对改进微博用户关注好友的推荐和信息推送提出一些建议。
语种:
中文
展开
数据挖掘中强局部加权回归算法实现
作者:
虞乐;肖基毅
期刊:
电脑知识与技术 ,2012年8(07):1493-1495 ISSN:1009-3044
作者机构:
南华大学计算机科学与技术学院,湖南衡阳,421001;[肖基毅; 虞乐] 南华大学
关键词:
数据挖掘;变参数回归模型;强局部加权回归
摘要:
线性回归是利用称为线性回归方程的最小二乘函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析.在数据挖掘中占有十分重要的地位.而强局部加权回归方法应用得尤为广泛.本文建立了变参数回归模型,并在算法上加以实现.
语种:
中文
展开
数据挖掘在用户上网行为分析中的应用研究
作者:
刘梦超;肖基毅;陈荣;贺祥
期刊:
电脑知识与技术 ,2012年(31):7409-7412 ISSN:1009-3044
作者机构:
南华大学 计算机科学与技术学院,湖南 衡阳 421001;南华大学 船山学院,湖南 衡阳 421001
关键词:
数据挖掘;用户上网行为分析;网络用户行为挖掘;网络用户行为模式;校园网用户上网行为分析
摘要:
严格遵循数据挖掘的步骤,采用时间序列挖掘算法,结合微软的BI数据挖掘工具(SQL Server Business Intelligence Development Studio)对从数据堂[9]上采集的数据集进行建模,从而挖掘出在特定时间段内用户的上网行为模式和潜在的上网规律,对校园网络的科学管理提出了合理的建议。
语种:
中文
展开
基于HMM和小波神经网络混合模型的Web信息抽取
作者:
李少天;肖基毅;虞乐
期刊:
微计算机信息 ,2012年(05):136-138 ISSN:1008-0570
作者机构:
南华大学计算机科学与技术学院
关键词:
信息抽取;隐马尔科夫模型(HMM);小波神经网络(WNN)
摘要:
提出一种将隐马尔科夫模型(HMM)和小波神经网络(wNN)相结合的混合模型应用于信息抽取。其首先将网页节点特征化,并依据网页内容建立不同的HMM,之后通过WNN调用相应的HMM用于信息抽取。HMM无法准确抽取的重要信息,利用WNN做辅助判别。实验证明,该混合模型可以提高Web信息抽取的精准度。
语种:
中文
展开
基于HMM/BP混合模型的文本信息抽取研究
作者:
杨红超;肖基毅
期刊:
计算机技术与发展 ,2011年21(5):115-117 ISSN:1673-629X
作者机构:
南华大学,计算机科学与技术学院,湖南,衡阳,421001;[肖基毅; 杨红超] 南华大学
关键词:
信息抽取;隐马尔可夫模型;BP网络
摘要:
作为自然语言处理的一个分支,文本信息抽取成为了提取大量文本信息中有用信息的重要手段。介绍了目前在信息抽取领域中应用广泛的两种技术方法:HMM和BP网络模型,分析了各自的优缺点,并在此基础上提出了一种基于两者的混合模型,该混合模型通过BP网络优秀的分类甄别能力来弥补HMM在分类方面的不足,而通过HMM强大的时域建模能力来弥补BP网络建模能力弱的问题,因此该模型具有强大的建模能力、分类性以及适应性强等特点。实验证明,相比传统的HMM以及BP网络模型,该混和模型在精确度和召回率上有了10%-15%的提高。
语种:
中文
展开
基于长距离依赖条件随机域的文本信息抽取
作者:
朱道辉;肖基毅;程阳;吴诗祥
期刊:
计算机应用与软件 ,2011年28(5):203-205 ISSN:1000-386X
作者机构:
[朱道辉; 肖基毅] 南华大学计算机科学与技术学院;[程阳] 广西师范大学生命科学学院;[吴诗祥] 武冈市大田乡中心小学
关键词:
长距离依赖;条件随机域;线性链;同一token;文本
摘要:
信息抽取中, 同一token在文本中可能出现多次, 且token多次出现的位置通常相隔很远, 传统线性链CRF模型由于Markov假设不能表达长距离依赖关系于是将多次出现的同一token分开标注, 丧失了全局信息。提出了长距离依赖条件随机域模型, 该模型能结合多次出现的同一token各处的特征, 对其进行联合标注。由于长距离依赖使得精确的标注算法不可计算, 采用了TRP估计算法。实验表明该模型抽取性能优于线性链CRF模型, 尤其是speaker域上的召回率有了很大的提高。
语种:
中文
展开
核与辐射环境数据交换技术规范与应用接口开发研究
作者:
李样兵;肖基毅;虞乐
期刊:
电脑知识与技术 ,2011年7(25):6069-6070+6081 ISSN:1009-3044
作者机构:
南华大学计算机科学与技术学院,湖南衡阳,421001;[肖基毅; 虞乐; 李样兵] 南华大学
关键词:
核与辐射;核应急;企业服务总线
摘要:
为核与辐射环境信息与核与辐射恐怖袭击事件的管理,建立一套信息交换的技术行业规范,开发通用的辐射环境数据、资料的生成、储存和交换模型,能够实现与网络化环境监测数据管理系统和其它数据库系统的数据、资料的交换。为核与辐射环境监测数据、核与辐射环境监督管理数据的交换提供统一的数据规范和标准化的基础支持。该文主要介绍了关键技术数据交换总线的概念、功能以及具体开发实现。
语种:
中文
展开
网格数据挖掘本体的建模
作者:
邵明前;肖基毅;陈增科
期刊:
数字社区&智能家居 ,2009年5(07):1552-1554 ISSN:1009-3044
作者机构:
南华大学,计算机科学与技术学院,湖南,衡阳,421001;[陈增科; 肖基毅; 邵明前] 南华大学
关键词:
网格;数据挖掘;本体
摘要:
网格技术的发展使网格数据挖掘成为处理分布异构海量数据的重要手段。该文将本体引入到网格数据挖掘中。讨论了网格数据挖掘本体的结构,并提出了网格数据挖掘本体的建立过程,最后讨论了网格数据挖掘本体实现。
语种:
中文
展开
Web服务合成技术在网格数据挖掘中的应用研究
作者:
陈增科;肖基毅;邵明前
期刊:
计算机技术与发展 ,2009年19(1):234-236,240 ISSN:1673-629X
作者机构:
南华大学,计算机科学与技术学院,湖南,衡阳421001;[肖基毅; 陈增科; 邵明前] 南华大学
关键词:
Web服务;数据挖掘;合成;网格
摘要:
在网格环境下,存在大量的数据挖掘服务,但传统数据挖掘系统难以满足用户实际应用的需求。提出把Web服务合成技术运用于网格数据挖掘中,对已有的服务进行合成,形成新的、方便用户使用的数据挖掘服务,探讨把传统的数据挖掘系统与OGSA和Web合成技术结合,构建一个开放数据挖掘系统,满足不同领域、不同层次的知识发现。
语种:
中文
展开
基于物元和QoS约束的数据挖掘服务选择
作者:
陈增科;肖基毅;陈灵娜;邵明前
期刊:
计算机工程 ,2009年35(24):90-92 ISSN:1000-3428
作者机构:
[陈增科; 肖基毅; 陈灵娜; 邵明前] 南华大学,计算机科学与技术学院
关键词:
数据挖掘服务;服务质量;物元;选择
摘要:
为更好地选择满足用户要求的数据挖掘服务,运用可拓物元模型描述数据挖掘服务和用户需求.对数据挖掘服务进行可拓分析,计算候选数据挖掘服务与用户需求服务的相似度.构造数据挖掘QoS用户约束元,设计用于评估相似服务的方法,帮助用户选择满足要求的数据挖掘服务.实验结果表明该方法提高了选择效率.
语种:
中文
展开
X射线在线电缆偏心检测数据仿真
作者:
陈坚祯;李斌;卫开夏;肖基毅;屈国普;...
期刊:
原子能科学技术 ,2008年42(1):77-82 ISSN:1000-6931
通讯作者:
Chen, J.-Z.
作者机构:
[陈坚祯] 上海大学,机电工程与自动化学院,上海,200072;[陈坚祯] 南华大学,计算机科学与技术学院,湖南,衡阳,421001;[李斌; 任晓; 卫开夏] 上海大学;[肖基毅; 屈国普] 南华大学
通讯机构:
School of Mechanical and Electronic Engineering and Automation, Shanghai University, China
关键词:
X射线;电力电缆;偏心度;仿真
摘要:
在X射线电缆偏心在线检测装置的研制中,在线检测数据的模拟仿真十分重要。从生产线实际出发,考虑生产中线缆摆动、噪声等动态因素对检测的影响,结合检测理论提出和建立了在线检测数据的仿真模型,并利用Matlab下Simulink工具实现其数据仿真。通过与实际数据对比,很好地实现了在线检测数据的模拟仿真。
语种:
中文
展开
A hybrid approach for web information extraction
作者:
Xiao, Ji-Yi* ;Zhu, Dao-Hui;Zou, La-Mei
期刊:
Proceedings of the 7th International Conference on Machine Learning and Cybernetics, ICMLC ,2008年3:1560-1563
通讯作者:
Xiao, Ji-Yi
作者机构:
[Zou, La-Mei; Zhu, Dao-Hui; Xiao, Ji-Yi] Univ S China, Sch Comp Sci & Technol, Hengyang 421001, Peoples R China.
通讯机构:
[Xiao, Ji-Yi] U;Univ S China, Sch Comp Sci & Technol, Hengyang 421001, Peoples R China.
会议名称:
2008 International Conference on Machine Learning and Cybernetics(2008机器学习与控制论国际会议)
会议时间:
2008-07-12
会议地点:
昆明
会议论文集名称:
2008 International Conference on Machine Learning and Cybernetics(2008机器学习与控制论国际会议)论文集
关键词:
Information eztraction;Hidden Markov model;Mazimum entropy;Mazimum entropy Markov model;Generalized iterative scaling
摘要:
This paper presents a new approach based on maximum entropy and maximum entropy Markov model for web information extraction. This approach is not only able to overcome the shortcoming of the less precision and recall of the hidden Markov model. In addition, this approach can make the most of various kinds of contextual information from web. The experiments are found that the hybrid approach has an average precision rate of 87.516% while the hidden Markov model trained by the Baum-Welch algorithm has an average precision rate of 68.630%. This implies that the hybrid approach is more optimized than the hidden Markov model trained by the Baum-Welch algorithm.
语种:
英文
展开
混合遗传算法和隐马尔可夫模型的Web信息抽取
作者:
肖基毅;邹腊梅;李传琦
期刊:
计算机工程与应用 ,2008年44(18):132-135 ISSN:1002-8331
作者机构:
[肖基毅; 邹腊梅; 李传琦] 南华大学计算机科学与技术学院;南华大学计算机科学与技术学院 湖南衡阳421001
关键词:
遗传算法;隐马尔可夫模型;Web信息抽取;Baum-Welch算法;最大似然算法
摘要:
传统Web信息抽取的隐马尔可夫模型对初值十分敏感和在实际训练中极易得到局部最优模型参数.提出了一种使用遺传算法优化HMM模型参数的Web信息抽取混合算法.该算法使用实数矩阵编码表示染色体,似然概率值为适应度取值,将GA与Baum-Welch算法相结合对HMM模型参数进行全局优化,并且调整GA-HMM的Baum-Welch算法参数实现Web信息抽取.实验结果表明,新的算法在精确度和召回率指标上比传统HMM具有更好的性能.
语种:
中文
展开
石油网格数据挖掘新技术研究
作者:
肖基毅;胡蓉;王以群
期刊:
西南石油大学学报(自然科学版) ,2008年30(3):152-154 ISSN:1674-5086
通讯作者:
Xiao, J.-Y.
作者机构:
南华大学计算机科学与技术学院,湖南,衡阳421001;南华大学经济管理学院,湖南,衡阳421001;[肖基毅; 王以群; 胡蓉] 南华大学
通讯机构:
Nanhua University, School of Computer Science and Technology, China
关键词:
网格;数据挖掘;本体;Web服务;数据集成;石油勘探开发
摘要:
针对石油勘探开发中很多TB级和PB级的数据集在许多情况下分布在一个组织的不同地点或不同组织的多个数据源被集团内所有用户共享的特点,用网格数据挖掘数据集成技术和网格数据挖掘本体技术,作为石油勘探开发行业业务工作流程的信息处理基础设施,以满足石油工业对高性能计算技术的持续需求.提出了Web service与网格技术融合、网格与数据集成技术结合和本体与Web service合成,给出了基于Globus Toolkit 4、开放式网格服务体系结构和Web服务的技术实现方案.研究表明:网格计算中的任务管理、任务调度和资源管理等服务可以为分布式数据挖掘提供极大的便利.
语种:
中文
展开
面向服务的分布式数据挖掘设计与实现
作者:
肖基毅;胡蓉;李传琦
期刊:
江西师范大学学报(自然科学版) ,2008年32(2):184-188 ISSN:1000-5862
作者机构:
南华大学计算机科学与技术学院,湖南,衡阳,421001;[肖基毅; 李传琦; 胡蓉] 南华大学
关键词:
网格数据挖掘;网格服务;网格计算;开放网格服务体系结构
摘要:
先进的应用持续产生非常大量有价值的数据,但是没有足够的技术来充分地抽取数据中潜在的知识.网格能为知识发现应用提供有效的计算支持.该文介绍了一个新颖的面向服务分布式高性能网格数据挖掘体系结构和设计原理.设计和实现了基于先进的Globus Toolkit 4和OGSA-DAI网格服务的分布式数据挖掘体系结构,并进一步用网格数据挖掘原型验证了该体系结构.
语种:
中文
展开