data 是名词,有单复数之争:① 正式/学术用法:data are(复数,传统用法:the data are conclusive = 数据是确凿的;data 是 datum 的复数);② 日常/现代用法:data is(单数,越来越普遍:the data is clear = 数据很清楚;尤其在科技和商业语境)。关键搭配:data analysis / collection(数据分析/收集);big data(大数据);personal data(个人数据,隐私相关);data protection(数据保护);a data set(数据集)。辨析:data(原始数据/统计)vs. information(信息,数据经处理后形成的有意义内容)vs. evidence(证据,支持主张的数据或事实)vs. findings(研究发现,研究得出的结论性信息)。
释义
1
n.(pl. or uncountable)数据,资料(用于分析的事实或统计数字)
The research team collected data from over ten thousand participants across six countries to ensure the findings were statistically robust.
研究团队从六个国家的一万多名参与者那里收集了数据,以确保研究发现在统计上是稳健的。
2
n.个人数据(数字信息时代)
The new legislation requires companies to be transparent about how they collect, store, and use consumers' personal data.
新立法要求公司在如何收集、存储和使用消费者个人数据方面保持透明。
语感
data analysis / collection(数据分析/收集);personal data(个人数据);data protection(数据保护);big data(大数据);a data set(数据集)
数据,资料(用于分析的统计或事实)个人数据(隐私:personal data protection)
高频搭配:collect / analyse / interpret data(收集/分析/解读数据);data analysis / collection / management(数据分析/收集/管理);personal data(个人数据:protect personal data = 保护个人数据);data protection / privacy(数据保护/隐私);big data(大数据:big data analytics = 大数据分析);a data set / database(数据集/数据库);data-driven(数据驱动的:a data-driven approach = 数据驱动的方法);单复数:data is(日常/科技/商业语境,越来越普遍)vs. data are(传统学术正式语境);辨析:data(原始事实/数字)vs. information(经整理有意义的内容:information is available = 信息可获取)vs. evidence(证据:evidence suggests = 证据表明)vs. statistics(统计数字:according to statistics = 据统计)。
陷阱
⚠️data is(日常/科技)vs. data are(学术/传统)——单复数争议
The data collected during the trial clearly supports the hypothesis that the new treatment reduces recovery time.
✗
× data supports(单数)永远错误;× data support(复数)是唯一正确形式
✓
data is(或 data supports)= 日常、科技、商业语境均已广泛接受(视 data 为整体、不可数);data are(或 data support)= 传统学术英语(视 data 为 datum 的复数);两种均可接受,选择哪个取决于语体:学术写作中 data are 更正式保险;报纸和科技文章中 data is 很常见;此句 data...supports = 可接受(现代用法),data...support = 传统学术;× data is / data are 不是「一对一错」而是「风格不同」
试验期间收集的数据清楚地支持了新疗法缩短恢复时间的假设。(data supports = 现代用法;data support = 传统学术,两者均可)
⚠️data(原始数字)vs. information(有意义的内容)——层次不同
✗
The survey generated a large amount of information on consumer spending habits, which researchers then had to code and analyse.
调查产生了大量关于消费者消费习惯的数据,研究人员随后不得不对其进行编码和分析。(× information → ✓ data,因为是原始未处理的调查数字)
data(数据,原始数字/观测值)vs. information(信息,经处理后有意义的内容);调查产生的「原始回答/数字」是 data;经处理后可用的「内容」是 information;此句 generated a large amount of...had to code and analyse = 需要编码分析 → 说明是原始的,应用 data;× information 若在此语境,意味着已经是可理解的内容,不需要「分析」;标准:surveys generate data;data analysis produces information
✓
The survey generated a large amount of data on consumer spending habits, which researchers then had to code and analyse.
调查产生了大量关于消费者消费习惯的数据,研究人员随后不得不对其进行编码和分析。(data = 原始数字;× information = 已处理有意义的内容)
近义辨析
datavsevidence
datadata(数据:data collection = 数据收集;raw data = 原始数据;较中性,指原始的事实和数字)evidenceevidence(证据:the evidence suggests = 证据表明;data used to support a claim;比 data 更强调「支持论点的功能」;anecdotal evidence = 轶事证据;empirical evidence = 实证证据)
The team spent three months gathering data on air quality in six urban areas before beginning the statistical analysis.
团队在开始统计分析之前花了三个月在六个城市地区收集空气质量数据。
There is growing evidence that regular physical activity in childhood is associated with better academic performance and improved mental wellbeing.
越来越多的证据表明,童年时期定期体育活动与更好的学业表现和改善的心理健康相关。
写作加分
✨ 加分词
替换:numbersfactsinformation
学术议论文科技话题政策分析话题
普通
We have many numbers that show climate change is getting worse.
我们有很多数字表明气候变化正在恶化。
加分 ✨
A growing body of empirical data confirms that global temperatures are rising at an unprecedented rate, providing an overwhelming scientific basis for immediate policy intervention.
越来越多的实证数据证实全球气温正在以前所未有的速度上升,为立即政策干预提供了压倒性的科学依据。
为什么更好:empirical data 比 numbers 更书面精确;a growing body of 表示积累的规模;an overwhelming scientific basis 升级证据力度;immediate policy intervention 引入政策层面
常用搭配
collect / analyse / interpret data收集/分析/解读数据
personal data / data protection个人数据/数据保护
big data / data-driven大数据/数据驱动的
a data set / database数据集/数据库
data is(日常)/ data are(学术)数据是(单复数之争,两者均可接受)
词根
data = datum(单数)的复数 → 「一条数据是 datum,多条是 data」;data-driven = 「被数据驱动」= 数据驱动的;database = data + base = 数据的基地 = 数据库;big data = 「大量数据」= 大数据
考考你
Q1对错判断
判断下面句子里的用法是否正确:
The data from the longitudinal study suggest that socioeconomic background is one of the most significant predictors of educational attainment.
纵向研究的数据表明,社会经济背景是教育程度最重要的预测因素之一。
data suggest(复数形式,传统学术用法)正确;suggest that = 从句结构;一of the most significant predictors = 最高级结构,语法正确;data suggests(单数)在学术写作中也日益接受,但 data suggest 在正式学术中更传统
Q2近义选词
选择最恰当的词填空:
There is strong ___ to suggest that early childhood nutrition has a lasting impact on cognitive development and academic outcomes.
Adata
Bevidence
✓ 有强有力的证据表明,幼儿期营养对认知发展和学业成绩有持久影响。
strong evidence(强有力的证据)比 strong data 更自然;there is strong evidence to suggest = 有证据支持(固定学术表达);evidence 强调「支持主张的功能」;× strong data to suggest 不是标准搭配(data 通常搭配 show/indicate,而非 suggest 带 to)
Q3义项辨析
下面四个句子中,最适合用 information 而不是 data 的是:
A
The hospital stored records of each patient's ___, including diagnoses, treatment history, and test results.
医院存储了每位患者的___,包括诊断、治疗史和检测结果。
B
The researchers coded all questionnaire responses as numerical ___ before entering them into the statistical software.
研究人员在将所有调查问卷回答输入统计软件之前将其编码为数字___。
C
The website provides clear ___ on how to apply for a student visa and what documents are required.
该网站提供了关于如何申请学生签证以及需要哪些文件的清晰___。
D
Environmental scientists analysed ___ from thousands of weather stations to track the progression of the storm.
环境科学家分析了来自数千个气象站的___,以追踪风暴的进展。
C 中适合用 information(有意义的内容:website provides information on how to apply = 关于如何申请的说明内容);A 中适合 data(患者记录,原始数字);B 中适合 data(问卷数字数据,编码后输入统计软件);D 中适合 data(气象站的原始测量数据)
接着学
点击进入该词的深度解析
statistics近义统计数字(statistics show = 统计显示;比 data 更强调经过处理的数字结论)
findings近义研究发现(the findings of the study = 研究发现;data 分析后得出的结论性内容)
raw近义原始的(raw data = 原始数据,未经处理;raw materials = 原材料;raw 是 data 的高频修饰词)
anecdotal近义轶事的(anecdotal evidence = 轶事证据;与系统性 data 相对:anecdotal vs. empirical data)