文字概率相当于数字概率具有模糊性-文字概率是什么

文字几率是指在给定的文本中,每一个词出现的几率。它是自然语言处理中的一个重要概念,用于衡量语言结构的复杂性和一致性。通常,一个词语出现的频率越高,其文字几率越大。

概率入门

该篇内容是在知乎上看到的Yjango大佬的分享做的笔记,原文是Joseph K. Blitzstein的《Introduce to Probability》中第一章的内容的理解。看过后做个总结

首先,对线性代数和概率做了一个概括性描述:

对此,我的理解是线性代数就像空间中的各种元素,通过权重的不同形成不同的物质(例如C、O原子不同比例能够组成CO、CO 2 等);而概率的意义在于既然物质形成千变万化,那么到底会生成那种物质的确信度(概率)是多少

下面的图片如何考虑转盘在未来停止后指针指向各个数字的可能性?(1、2、3是可能被指到的三个结果,这三个结果组成的集合也就是样本空间(sample space))

而样本空间的子集,如{1、2}叫作一个事件(event),表示指针指到1或2的情况,满足任何一个情况都算作该事件发生了(occurred)。所有事件发生的可能性都用值域为[0,1]间的实数表示,1表示必然发生,0表示不可能发生。{1}, {2,3}两个不相交的事件的概率和为1。[0,1]间的实数是概率得出的值,但并非概率的全部。概率是一个函数。

概率P()将事件A作为输入,并输出[0,1]之间的实数表示其发生的可能性。该函数需要满足两个条件:

人们在计算概率时常常犯的错误就是不假思索的假定所有结果所发生的可能性都相同。并用事件的结果个数比上样本空间的结果个数。(就是把问题都想成了扔硬币)

A和S表示集合中元素的个数

这种假设是不严谨的:在上图圆盘中,如果使用朴素概率来计算P(1) = P(2) = P(3) = 1/3,但是指向3的结果面积占圆盘的一半,指向3的概率更大,则各个结果发生的可能性并不相同,不可以使用朴素概率算法。

当我们获得更多信息后,新信息会对原始样本空间产生更新。(简单来说就是信息对概率的影响)

人们经常将P(A|B)和P(B|A)搞混,把二者搞混的现象叫做检察官谬误(prosecutor's fallacy)。

随机变量是一种非常方便的事件表达方式。

我们用文字表达事件和概率时,往往不利于计算

一个样本空间可以有很多个随机变量。在最初的例子,我们就已经将样本空间S={橘黄色,绿色,蓝色}对应到了实数域中的1,2,3。

随机变量作为函数而言是确定的。输入事件橘黄色,一定会得到1这个输出,函数本身并没有什么“随机”。“随机”是由于函数的输入(可能是黄色,绿色,蓝色)的发生概率。

X = 3表达的是指针指到蓝色的事件。P(X = 3)表达指针指到蓝色的事件的概率。

随机变量是认为事先选择的,非常灵活,好的随机变量会使问题简化许多。

根据随机变量投射后的值域是离散还是连续,随机变量可以分为离散随机变量和连续随机变量。

随机变量中的“随机”来自事件发生的概率。分布(distribution)是描述随机变量所对应的所有事件的发生概率的情况。