尔云间 一个专门做科研的团队

原创 eryun 云生信学生物信息学 关注我们

怎样查找geo数据(你可能根本不知道的GEO数据查询技巧)(1)

01✦✦常规筛选

在GEO数据库搜索所需数据集的时候,条目太多,一个个点进去筛选耗时耗力,效率不高。

通常我们可以通过geo界面左右两侧给的一些选项进行筛选

数据记录类型:atasets、series、samples和platforms

怎样查找geo数据(你可能根本不知道的GEO数据查询技巧)(2)

选择来源物种

怎样查找geo数据(你可能根本不知道的GEO数据查询技巧)(3)

测序平台:DNA、mRNA、SNP、甲基化等等

怎样查找geo数据(你可能根本不知道的GEO数据查询技巧)(4)

限定作者

怎样查找geo数据(你可能根本不知道的GEO数据查询技巧)(5)

限定样本类型

怎样查找geo数据(你可能根本不知道的GEO数据查询技巧)(6)

限定数据上传时间

怎样查找geo数据(你可能根本不知道的GEO数据查询技巧)(7)

02✦✦检索式搜索

上述是网上经常提到的筛选方法,但今天我发现一个有意思的地方,感觉可以探索一下

当我以“undifferentiated carcinoma”为关键词进行搜索时

怎样查找geo数据(你可能根本不知道的GEO数据查询技巧)(8)

它右侧输入框显示"carcinoma"[MeSH Terms] OR undifferentiated carcinoma[All Fields]

怎样查找geo数据(你可能根本不知道的GEO数据查询技巧)(9)

当我们点击See more出现以下界面

怎样查找geo数据(你可能根本不知道的GEO数据查询技巧)(10)

Query Translation这里提示我也可以在GEO使用检索式进行检索

针对"carcinoma"[MeSH Terms] OR undifferentiated carcinoma[All Fields]这一命令进行解读

它是在关键词MeSH Terms中对carcinoma进行精确搜索,OR 或 ,在所有字段[All Fields]中搜索undifferentiated carcinoma。

而我们在搜索框中输入的undifferentiated carcinoma,我是想对undifferentiated carcinoma进行一个精确的搜索,通常使用双引号””便可进行精确搜索

怎样查找geo数据(你可能根本不知道的GEO数据查询技巧)(11)

怎样查找geo数据(你可能根本不知道的GEO数据查询技巧)(12)

我们可以看到在进行精确搜索前我们得到了238298条数据,而精确搜索后就只有64条数据,有量级的差别

这也说明了我们是可以在GEO数据库使用检索式进行搜索

而我们也可以使用All Fields,Title,MeSH Terms,Description这些限定检索字段

怎样查找geo数据(你可能根本不知道的GEO数据查询技巧)(13)

上图显示[Description]是被正常识别的

当然一些常规的符号也是能识别的,比如:

“|”或——并行搜索、

“-”非——消除无关性、

“ ”加号 —— 强制包含关键词

怎样查找geo数据(你可能根本不知道的GEO数据查询技巧)(14)

这里|就被识别为了OR,当然你也可以直接输入OR。

,