本发明涉及信息检索领域,具体为一种基于大数据应用的短文本信息检索系统,包括分类采集系统和短文本预处理模块,所述分类采集系统的输出端信号连接词段预处理模块的输入端,词段预处理模块输出的词段依次经过词段拆分模块和词段分集模块处理后,将拆分词关联集合的数据传输到共享数据库中,本发明功能涉及合理,在大数据的数据基础上,对检索词段进行统计和处理,在进行短文本信息检索时,将短文本合理拆分和组合,经过词段逆推得出词频,由词频的大小进行信息输出,很大程度上简化了检索系统的负担,并且实现了快速的对比,在大数据的实时更新状态下,能够提高信息检索的时效性,并且避免了数据的检索遗漏。