原创 eryun 云生信学生物信息学 关注我们
01✦✦常规筛选
在GEO数据库搜索所需数据集的时候,条目太多,一个个点进去筛选耗时耗力,效率不高。
通常我们可以通过geo界面左右两侧给的一些选项进行筛选
数据记录类型:atasets、series、samples和platforms
选择来源物种
测序平台:DNA、mRNA、SNP、甲基化等等
限定作者
限定样本类型
限定数据上传时间
02✦✦检索式搜索
上述是网上经常提到的筛选方法,但今天我发现一个有意思的地方,感觉可以探索一下
当我以“undifferentiated carcinoma”为关键词进行搜索时
它右侧输入框显示"carcinoma"[MeSH Terms] OR undifferentiated carcinoma[All Fields]
当我们点击See more出现以下界面
Query Translation这里提示我也可以在GEO使用检索式进行检索
针对"carcinoma"[MeSH Terms] OR undifferentiated carcinoma[All Fields]这一命令进行解读
它是在关键词MeSH Terms中对carcinoma进行精确搜索,OR 或 ,在所有字段[All Fields]中搜索undifferentiated carcinoma。
而我们在搜索框中输入的undifferentiated carcinoma,我是想对undifferentiated carcinoma进行一个精确的搜索,通常使用双引号””便可进行精确搜索
我们可以看到在进行精确搜索前我们得到了238298条数据,而精确搜索后就只有64条数据,有量级的差别
这也说明了我们是可以在GEO数据库使用检索式进行搜索
而我们也可以使用All Fields,Title,MeSH Terms,Description这些限定检索字段
上图显示[Description]是被正常识别的
当然一些常规的符号也是能识别的,比如:
“|”或——并行搜索、
“-”非——消除无关性、
“ ”加号 —— 强制包含关键词
这里|就被识别为了OR,当然你也可以直接输入OR。
,