ACMChina – DL Pearls from China, July 2008
ACMChina – DL Pearls from China, July 2008
- Towards Identity Anonymization on Graphs
-
International Conference on Management of Data
Proceedings of the 2008 ACM SIGMOD international conference on Management of data
Pages: 93-106
Year of Publication: 2008
ISBN:978-1-60558-102-6
Authors: Kun Liu and Evimaria Terzi
Abstract Translated by: 吴昊
Abstract:
多种应用背景下的网络数据的大量涌现,使得人们开始关注保护个体隐私的问题。新近的研究显示,在发布图或社会网络数据时,简单的将每个节点的身份信息 去掉是不能保证它们的隐私的,图的结构信息(用节点的度表示)本身就会泄露个体的身份。为了解决这个问题,我们对一种特殊的图匿名问题进行了研究:如果对 于每个节点v,在图中都至少存在k-1个与之具有相同的度的其它节点,我们就称这个图是k-度匿名的。如果攻击者预先知道某些节点的度,那么这种定义下的 匿名,可以避免这些节点对应的个体被重新识别出来。我们将图的匿名化问题形式化的定义如下:给定图G,寻找通过对G进行最少的修改操作而得到的k-度匿名 的图。为了解决这个问题,我们基于度序列的可实现性原则设计了一个简单并且高效的算法。我们将该方法应用在一系列人工和真实的数据集上,验证了它的有效性 和实际价值。
- Morph-based speech recognition and modeling of out-of-vocabulary words across languages
-
ACM Transactions on Speech and Language Processing (TSLP)
Volume 5 , Issue 1 (December 2007)
Article No. 3
Year of Publication: 2007
ISSN:1550-4875
Authors: Mathias Creutz, Teemu Hirsimäki, Mikko Kurimo, Antti Puurula, Janne Pylkkönen, Vesa Siivola, Matti Varjokallio, Ebru Arisoy, Murat Saraçlar, and Andreas Stolcke
Abstract Translated by: 贾珈
Abstract:
这篇文章将基于语素的语言模型应用于大词汇量的连续语流语音识别系统,识别系统涵盖4种语素丰富的语言:芬兰语、爱沙尼亚语、土耳其语和埃及阿拉伯口 语。语素是通过非监督的、数据驱动的Morfessor算法从语音里抽取出来的。通过使用基于语素序列而不是词语的n元语法模型,可以增加词汇的覆盖,减 少数据的稀疏性,从而提高基于语素的语言模型的性能。标准的词汇模型通常存在OOV(out-of-vocabulary)率高的问题,而语素模型可以通 过拼接语速的方法识别之前从未出现过的词汇形式。实验结果显示,语素模型确实可以提高OOV词汇的识别率,并不会降低词典内词汇的识别准确率。标准模型仅 在识别阿拉伯语时比语素模型具有更好的性能。不同的数据集和数据量可能会对识别结果有所影响。
A normality based method for detecting kernel rootkits-
ACM SIGOPS Operating Systems Review
Volume 42 , Issue 3 (April 2008)
Pages: 59-64
Year of Publication: 2008
ISSN:0163-5980
Authors: Doug Wampler and James H. Graham
Abstract Translated by: 薛瑞尼
Abstract:
Rootkits是实现隐藏自身的恶意软件,可以使入侵者获得系统的控制权,攻击其他系统,破坏其入侵证据以降低被探测到的几率。现有的探测方法大多 依赖系统的先验知识:或者在系统被入侵前保存其状态,在入侵后比较系统状态;或者在被入侵前安装探测软件,这种方法的先验知识来自于大量操作系统和体系结 构的统计特性。
本文提出一种改进的基于正态分布的探测方法可以有效地发现通过修改系统调用目标而注入内核的Rootkit。本方法基于这样的事实:系统调用按顺序被 装载如内存,高层调用首先被加载,也容易被Rootkits入侵,底层调用随后加载。enyelkm是一个通过修改系统调用目标来入侵系统的 Rootkit,我们选择他它来评价本文提出的方法,测试结果显示没有误判。