为什么我现在不再痴迷于“智商”这个东西了

今天早晨受到了我的dna测试结果,是通过微基因 wegene.com)做的,从其得知我竟然有接近百分之三十的蒙古血统。结果我分享给了我认识的一位满族姑娘,她觉得挺酷的,并向我提到了满清奠基者爱新觉罗·努尔哈赤。这个名字我熟悉,毕竟之前读过,但太难记了,所以还得查一下确认。然后我想到,百分之三十的蒙古血统,那我会不会是成吉思汗的后代啊,我想成吉思汗这个名字远远更多人知道。

昨天晚,也有一个美国留学回来的做软件的男生向我抱怨中国的文科高考生和女生,他还说他只能接受理工科女生。与我不同,他非常强调英语教育,甚至觉得有条件的人学英语应该找私教。他觉得英语是个做某些技术工作离不开的信息渠道,说尤其在他的行业。我跟他说我觉得中国的好多学习智商一般的姑娘面容和性格都特别可爱,我不在意她们不是学霸,生活应该是多元化的,他却说那是因为你还没有被女人利用或骗过。

这些不得不让我想起美国的英文界的智商研究。Philippe Rushton, Richard Lynn, Arthur Jensen, Charles Murray, Linda Gottfredson这些名字和他们说的那套话我不是不知道,以及我跟Steve Hsu这位智商基因狂也有过些来往。查了一下,我就想起了那个Falconer’s formula,其为

h = 2\cdot (r(monozygotic) - r(dizygotic))

在以上公式,h是遗传度,r是统计相关分别在同卵(монозиготный)双胞胎和异卵(дизиготный)双胞胎数据集上。

该公式的构建逻辑可以说比较粗(但统计经常是这样的),但是以适当的思维方式是完全走得通的。基本上是同卵双胞胎的共同基因是100%,而(同性别的)异卵双胞胎如兄弟或姐妹的期望共同基因是50%。为什么呢,因为孩子的dna是由父母的dna随机混合生成的。这个同卵而非仅兄弟姐妹也有意义因为同年龄以及在共同家庭长大意味着同样的家庭环境。多于的相关代表多于的50%的基因的相同导致的结果,因为它是50%,所以得乘上2。

以同样的逻辑,也可以估计共同家庭环境的影响,其公式为

r(together) - r(apart)

当然是要运用到同卵双胞胎上(或者类似的其它因素被控制的对上)。以下给读者提供一些数据。

智商的确能预测一个人的不少人生结果,统计而言,可是这种预测也毫无疑问是粗略的,在人生涉及到的杂乱无章,以非线性方式互相影响的因素中。

我个人认为只有少数东西才真正需要高智商。相反,在大多平凡日常生活中,大的智商差异基本上是无关的。在很多事情及交流上,我跟一位具有主流价值观和文化的智商一般的中国人的共同点要远远大于我和一位至少高于平均三个标准差的美国白人甚至美国华人。这一点也涉及到了劳动力的价值与人的价值的根本区别,这个我也就不多解释了。简而言之,政治立场和专业能力是两个不同的维度。研究以及痴迷智商的人经常重才轻政,轻政也自然代表轻视“集体智商”或“集体能量”。美国华人的智商,尤其在顶端,是高于中国的中国人的智商的,但他们的集体能量要远远低于中国的中国人。

所以中国的妹子说她是学渣,我就跟她们说我不在意,因为智商只是多维度的一个,尤其对于女性。同样,在美国主流社会,基本没什么人太在乎一个超聪明的黄种人(Nobody in America cares about an educated yellow man)。

今天也有一位中国比较一般的大学理论物理教授向我抱怨他的数学方法课100个学生只有一两个能算出

\displaystyle\lim_{x \to 0} \frac{\sin x}{x} = 1

我一看到了那个先想到了级数展开,以及如果你不知道\sin的级数,那可以观察到这个极限是个导数,其值为\cos 0。我只能跟他说微积分跟软件开发不一样,还是有点智商或抽象思维能力,不得强求,比如好多生物学家这个也都不会。当然,做那些用到些数学或统治的生物学分支的“生物学家”或那些有点数学能力的但依然选择了生物那种偏实验以及非量化严谨思维的研究方向的人肯定也会觉得这个太简单了。比如像李景均这样的人,他是民国时期获得美国博士的,也是群体遗传学(population genetics)的奠基人之一,可惜他50年由于政治原因逃到了香港,然后又去了美国,在那儿度过了多于半个世纪的充实的学术人生,2003年逝世。我倒有点好奇Steve Hsu是否知道这个也以统计研究过智商的人,有空我可以问问。

Advertisements

American internet products are actually crap compared to Chinese and Russian ones

Recently, I met (online) this guy in a large city in Siberia who is a software engineer. And he actually did some difficult programming, like assembler for micro-controller for a Russian company. He also achieved 2100+ on TopCoder (almost red), which is better than I did. I asked him about Petr Mitrichev that demigod in competitive programming (though I think the younger Belarussian Gennady Korotkevich has surpassed him). He pointed to these humorous “facts” about Petr Mitrichev: https://habr.com/ru/post/23434/. They were similar to the “compilers don’t warn Jeff Dean, Jeff Dean warns compilers” bullshit you hear in the Google style cult of personality.

I conversed with him through Russian Facebook vk.com. And when I wanted to find that comment of his about Petr. I searched петр (we sometimes talk with Russian), and within a few seconds (or less) came out the following.

2020-01-14 下午9.21.00

Well, the search result didn’t exactly have the link I wanted to navigate to, but I remember that I had commented with the Jeff Dean analogy afterwards, so I clicked on that scrolled up a bit and got to, from which I copy the link (that’s pasted here).

2020-01-14 下午9.30.29

In contrast, on Facebook, which I deleted, the search function takes like forever to return and you’re only able to navigate through one by one. I also recall Facebook inserting ads in between my contacts on its Messenger app, forcing me to see them. Interestingly, once right after I complained about certain Jewish behavior that basically nobody likes to my WASP friend on Facebook, he sent me a screenshot of some ad targeted to him on Facebook of something that explicitly mentioned “Jew”. You see, these American companies are all after your money, actually creating a good product for the user is secondary concern to them.

Similarly, Disqus doesn’t have either search or content recommendation (imagine how much more ad revenue they could make with some content recommendation enabled). So I created a search for them, so that I could actually search through thousands of comments with keywords.

AWS had some functionality problems (surprised how lacking it was relative to my expectations), so I pointed the domain www.disqussearch.com to the Heroku instance instead. Below I am searching the Disqus comments of a user with over 6000 comments with “IQ” in it, limiting to the latest 1000 comments.

2020-01-14 下午9.39.43

As for Chinese internet products, WeChat allows searching through your chats very quickly,

QQ Browser lets you easily navigate to and view the files and videos downloaded.

As far as video downloading is concerned, I do download some videos from YouTube with youtube-dl (more need to perhaps since YouTube is blocked in China). The Chinese video sites, at least on mobile, pretty much let you directly download. Whereas, as I am told by that Siberian Russian, Google deletes all extensions from its Chrome web store, which facilitate downloading of YouTube videos.

2020-01-14 下午10.02.48

By the way, I consider copyright and “intellectual property” to be mostly full of shit. Good thing China is not copyright obsessed the way America is. Videos are readily shared and content is copied online a lot. Many of the really high quality Chinese TV series and documentaries are free for you to watch online.

In the 1950s, from what I read, USSR for many of the designs it shared to China basically only charged a printing free. Whereas with America, it’s a whole other story. Even when China has gotten so little actual serious technology from America (I was told that there were even export controls for distributed systems technology, with some US company having to put its China servers in Singapore), the American media outlets are always whining and exaggerating about Chinese espionage. I would not be surprised if in the next year or two US mainstream media starts to report on “Princeton computer science professor Kai Li transferring American fingerprint recognition to the authoritarian Chinese regime.”

I guess you could say that the stuff mentioned here is not really technology, that it’s more stylistic, and that most of the foundational software is still “American”. I do agree with that, but I think Europe also contributed a ton to them (America takes the credit of course), not to mention that Russia is also not bad, with Nginx, Kotlin, Kaspersky, etc.

By the way, this reminds me of that article expressing low opinion of China in computing by Stanford computer science professor James Landay, who does “human computer interaction.” I think he, in a more stylistic field, is full of shit. I think that Americans and the Anglo world in general has really shitty taste. Look at the shitty American entertainment industry for example. I also don’t like the way they look, but I concede that this aesthetics is highly subjective. Still, I have a hard time imagining how anyone who’s not mentally broken would want to use English once they know Chinese or Russian, English is just such an ugly language. Its poetry is basically garbage. To the Chinese and Russians, Anglos have no soul.

I think the shitty taste of the Anglo world reflects in the aesthetics (and also choice of features) of its software as well.

Ties of Chinese-American scientists to China

I’ve noticed in America that Jews often have close ties to Israel, including the scientists and engineers and also the business people. But because of the nature of US-Israel relations, and also that Jews more or less control media and politics in America, that’s okay, even encouraged.

Whereas a Chinese scientist or engineer in America with ties to the Chinese government, that would be a major “red flag” (note the pun here). Like Princeton computer science professor Kai Li’s association (being on the Board, he surely has some significant stakes in the company) with that company Moqi which would be, in the eyes and words of America, creating a fingerprint recognition system for the police department of an communist authoritarian regime.

Some college student in China was shocked when I told him that white Americans don’t really give a fuck about distinguished Chinese-American scientists like Andrew Yao or Yigong Shi or Shoucheng Zhang, despite their being all over the Chinese media now. To white Americans, their names are alien and hard to pronounce. Not to mention they take coveted tenured professorships at top universities. As un-PC as it is to say, Shoucheng Zhang dying means Stanford can actually hire another tenured theoretical physicist. So many young smart people would kill for that position in America. So naturally, there is anger when he uses the prestige of that to create a venture capital firm in Silicon Valley for Chinese.

I also stumbled upon this Future Science Prize, a prize for Chinese scientists with prize money of $1 million, funded by the likes of Robin Li (founder of Baidu) and similar Chinese private sector entrepreneurs. The committee is full of mostly mainland origin ethnic Chinese (often with American citizenship) professors, many at distinguished US universities and elected to various US national academies. Those people know that in America, people outside their very narrow field don’t really give a fuck about them, which means that they have to “reconnect with China.” Using the word “reconnect,” they are not mainstream in China either; they are seen by many if not most in China as “American.”

And that Kai Li is also on its prize committee: http://futureprize.org/en/people/91.html.

2020-01-09 下午12.12.57

These elite Chinese-Americans may think they’re like Jews, but in reality, they are like Jews in Germany in 20s and 30s but less powerful. I’ll put it at that.

创办斯坦福大学的铁路资本家曾公开支持了美国的排华方案

在一个微信群里,有些人提到了英语博物馆的中国文物,以及当年日本掠夺的中国文物。这不得不让我想到好几年前在斯坦福大学的一个纪念在中国待过的美国总统Hoover校友的展览馆有不少中国清朝的文物,记得那儿的中国游客也都觉得是掠夺的。

其实,斯坦福大学是个19实际美国铁路资本家创办的大学。他也是支持排华反感的主要人之一。记得一位在清华待过的人跟我强调过清华大学是庚子赔款建立的培养留美生的中国大学,若按这种标准说话,斯坦福大学就更糟糕了。所以张首晟还想利用斯坦福大学的名气和威望给中国人在硅谷搞风投商,最后还是被黑了。

我刚在必应国际版查了stanford railroad,它展示的维基百科内容将斯坦福反华的那块我截屏了一下。所以那个人说要打压自愿获取美国学位的中国人还是很有道理的。我也有美国大学学位,我知道美国大学是什么样的,政治文化风气是多么烂的,可以因为我很小去了美国而不是以欲望镀金的心态自愿废了很大功夫而大学或研究生去的美国,我跟那些真正的留美海龟还很不一样。

其实我也认识不少斯坦福的毕业生,当然回国后就没跟他们联系了,这些就不多说了。

[contextly_main_module]

AWS sucks and I am removing disqussearch.com from it (AWS不给力,我从它删除了我做的disqus搜索)

There have never been any stability problems with https://pacific-waters-11622.herokuapp.com whereas the one deployed on AWS becomes unresponsive every once in a while. I have to restart it on AWS. Also, I encountered some SSH problems and lately have not been able to connect to the database even, so I cannot see how many visitors I am getting.

Also, not to mention that the Heroku deployment responds more quickly and more “in real time.” I had it programmed to update the response after every 5-10 comments or so through chunked encoding mechanism of HTTP, but on AWS, I had to tweak the nginx config to actually make that work.

I never intended to use AWS and only did because Heroku wouldn’t accept my credit card (or that of somebody else I tried). So on Heroku I could not add a database or domain name.

The code’s on Github. Whoever is interested in welcome to deploy it himself.

https://github.com/gmachine1/disqus-comment-search

I am hoping that the search engines will index https://pacific-waters-11622.herokuapp.com and place it on the first page of search results. That might take some time though.

The founders Jason Yan and Daniel Ha are also welcome to contact me. I tried contacting them to no success.

BTW, I also considered using JElastic as well as deployment on Aliyun (that’s Alibaba’s cloud service). I saw that JElastic has a ton of Russians in its leadership (and also Mark Zbikowski, important guy in Microsoft’s OS development) and I had even contacted them on their page.

It’s also interesting that Disqus was founded by kids of Chinese and Korean immigrants in America. I think they graduated from UC Davis for undergrad. They were a YC funded company I believe.

Russian translation:

Там никогда не было никаких проблем со стабильностью https://pacific-waters-11622.herokuapp.com в то время как один из них, развернутый на AWS, время от времени перестает отвечать на запросы. Я должен перезапустить его на AWS. Кроме того, я столкнулся с некоторыми проблемами SSH и в последнее время не смог подключиться к базе данных даже, поэтому я не могу видеть, сколько посетителей я получаю.

Кроме того, не говоря уже о том, что развертывание Heroku реагирует быстрее и более “в реальном времени”.”Я запрограммировал его на обновление ответа после каждых 5-10 комментариев или около того через механизм фрагментированного кодирования HTTP, но на AWS мне пришлось настроить конфигурацию nginx, чтобы на самом деле это сработало.

Я никогда не собирался использовать AWS и сделал это только потому, что Heroku не принимала мою кредитную карту (или чью-то еще, которую я пытался использовать). Поэтому на Heroku я не мог добавить базу данных или доменное имя.

Код находится на Github. Тот, кто заинтересован в этом, может развернуть его сам.

https://github.com/gmachine1/disqus-comment-search

Я надеюсь, что поисковые системы будут индексировать https://pacific-waters-11622.herokuapp.com и разместите его на первой странице результатов поиска. Но это может занять некоторое время.

Основатели Джейсон Ян и Даниэль Ха также могут связаться со мной. Я пытался связаться с ними, но безуспешно.

Кстати, я также рассматривал возможность использования JElastic, а также развертывания на Aliyun (это облачный сервис Alibaba). Я видел, что у JElastic есть тонна русских в ее руководстве (а также Марк Збиковский, важный парень в разработке ОС Microsoft), и я даже связался с ними на их странице.

Интересно также, что Disqus был основан детьми китайских и корейских иммигрантов в Америке. Я думаю, что они закончили университет Дэвиса для студентов. По-моему, это была компания, финансируемая YC.

Chinese translation:

从未有过任何稳定性问题https://pacific-waters-11622.herokuapp.com 而在AWS上部署的那个在一段时间内每隔一段时间就会变得无响应。 我必须在AWS上重新启动它。 此外,我遇到了一些SSH问题,最近甚至无法连接到数据库,所以我看不到我得到多少访问者。

此外,更不用说Heroku部署更快速,更”实时”响应。”我已经编程通过HTTP的分块编码机制来更新每个5-10个注释后的响应,但在AWS上,我必须调整nginx配置才能实际工作。

我从来没有打算使用AWS,只是因为Heroku不会接受我的信用卡(或者我试过的其他人的信用卡)。 因此,在Heroku上,我无法添加数据库或域名。

代码在Github上。 谁有兴趣欢迎自己部署它。

https://github.com/gmachine1/disqus-comment-search

我希望搜索引擎将索引https://pacific-waters-11622.herokuapp.com 并将其放置在搜索结果的第一页上。 这可能需要一些时间。

我们的创始人Jason Yan和Daniel Ha也欢迎您与我联系。 我试图联系他们没有成功。

顺便说一句,我也考虑过使用JElastic以及在Aliyun上的部署(这是阿里巴巴的云服务)。 我看到JElastic在其领导层中拥有大量的俄罗斯人(以及微软操作系统开发中的重要人物Mark Zbikowski),我甚至在他们的页面上联系了他们。

同样有趣的是,Disqus是由美国的中国和韩国移民的孩子创立的。 我认为他们是从加州大学戴维斯分校毕业的本科生。 他们是我相信的YC资助的公司。

[contextly_main_module]

中国计算机发展史

我国第一台半导体大型体计算机

编辑 讨论

我国第一台半导体大型体计算机103机(定点32二进制位,每秒2500次)在中国科学院计算技术研究所诞生,并于1958年交付使用。参与研发的骨干有董占球、王行刚等年轻人。随后,由总参张效祥教授领导的中国第一台大型数字电子计算机104机(浮点40二进制位、每秒1万次)在1959年也交付使用,骨干有金怡濂,苏东庄,刘锡刚,姚锡珊,周锡令等人。其中,磁心存储器是计算所副研究员范新弼和七机部黄玉珩高级工程师领导完成的。在104机上建立的、由仲萃豪和董韫美领导的中国第一个自行设计的编译系统,则在1961年试验成功(Fortran型)。
中文名
我国第一台半导体大型体计算机
类    别
科学
相关人物
高庆狮
时    间
1961年

目录

发展要素

编辑

中国科学院院士、北京科技大学教授 高庆狮
编者按: 一转眼,中国的计算机事业已经走过了50个春秋。在《计算机世界》纪念中国计算机事业发展50年的过程中,我们看到,在这50年里,有太多激动人心的创举出现,也有太多令人黯然的无奈穿过。
几代大师为了中国计算机事业的发展鞠躬尽瘁,更多人为了中国计算机产业的前行奋发图强。为此,我们特邀中国科学院院士、北京科技大学教授、中国科学院计算技术研究所终身研究员高庆狮撰写此文,以纪念过往、庆祝成就,同时也警醒现状、激励未来。
50年风雨之后,为了寻求ICT的融合和计算领域的更大发展,中国正在积极酝酿更好的政策环境。2006年8月29日,全国信息产业科技创新会议在京召开。
自从1946年,世界上第一台数字电子计算机在美国诞生,与计算机最邻近领域的数学和物理界的共和国泰斗、世界数学大师华罗庚教授和中国原子能事业的奠基人钱三强教授,十分关注这一新技术如何在国内发展。
中国诞生计算机
从1951年起,国内外和计算机领域相近的其他领域人才,尤其是从国外回来的教授、工程师和博士,不断转入到该行业中。他们当中的很多人,都在华罗庚领导的中科院数学所和钱三强领导的中科院物理所里,其中包括国际电路网络权威闵乃大教授、在美国公司有多年实践经验的范新弼博士、在丹麦公司有多年实践经验的吴几康工程师,以及从英国留学回来的夏培肃博士和从美国留学回来的蒋士飞博士。
他们积极推动,把发展计算机列入12年发展规划。
1956年3月,由闵乃大教授、胡世华教授、徐献瑜教授、张效祥教授、吴几康副研究员和北大的党政人员组成代表团,参加了在莫斯科主办的“计算技术发展道路”国际会议,到前苏联“取经”,为我国制定12年规划的计算机部分做技术准备。当时的代表团主要成员后来都参加了12年规划。此外,范新弼、夏培肃和蒋士飞也加入规划制定中。在随后制定的12年规划中,确定了中国要研制计算机,并批准中国科学院成立计算技术、半导体、电子学及自动化等四个研究所。
计算技术研究所筹备处由科学院、总参三部、国防五院(七机部)、二机部十局(四机部)四个单位联合成立,北京大学、清华大学也相应成立了计算数学专业和计算机专业。为了迅速培养计算机专业人才,这三个单位联合举办了第一届计算机和第一届计算数学训练班。计算数学训练班的学生有幸听到了刚刚归国的钱学森教授和董铁宝教授讲课。钱学森教授在当时已经是国际控制论的权威专家,而董铁宝教授在美国已经有过3~4年的编程经验,也是当时国内惟一真正接触过计算机的学者。当时我也是学生之一。
钱学森的数学功底的深度和广度几乎涵盖了我们所学的数学的所有课程,而且运用自如,我们作为北大数学系学生,对此感到十分钦佩。同时,钱学森教授也帮助我们具体了解到,数学如何应用到实际物理世界中。
在前苏联专家的帮助下,由七机部张梓昌高级工程师领导研发的中国第一台数字电子计算机103机(定点32二进制位,每秒2500次)在中国科学院计算技术研究所诞生,并于1958年交付使用。参与研发的骨干有董占球、王行刚等年轻人。随后,由总参张效祥教授领导的中国第一台大型数字电子计算机104机(浮点40二进制位、每秒1万次)在1959年也交付使用,骨干有金怡濂,苏东庄,刘锡刚,姚锡珊,周锡令等人。其中,磁心存储器是计算所副研究员范新弼和七机部黄玉珩高级工程师领导完成的。在104机上建立的、由仲萃豪和董韫美领导的中国第一个自行设计的编译系统,则在1961年试验成功(Fortran型)。

发展历程

编辑

国防是首要服务对象
在任何先进国家,计算机的发展首先都是为国防服务,应用于国家战略部署上,中国也不例外。1958年,北京大学张世龙领导包括当时作为学生的王选在内的北大师生,与中国人民解放军空军合作,自行设计研制了数字电子计算机“北京一号”,并交付空军使用。当时中国人民解放军朱德总司令还亲自到北京大学北阁“北京一号”机房参观了该机器。随后,张世龙带领北大师生(包括王选和许卓群在内),立即投入北大自行设计的“红旗”计算机研制工作,当时设定的目标比前苏联专家帮助研制的104机还高,并于1962年试算成功。但是由于搬迁和文革的干扰,搬迁后“红旗”一直没有能够恢复和继续工作。
与此同时,1958年,在哈尔滨军事工程学院(国防科技大学前身)海军系柳克俊的领导下,哈尔滨军事工程学院和中国人民解放军海军合作,自行设计了“901”海军计算机,并交付海军使用。在海军系康继昌的领导下,哈尔滨军事工程学院和中国人民解放军空军合作,自行设计的“东风113”空军机载计算机也交付空军使用。随后,柳克俊领导的国产晶体管军用的计算机,也在1961年交付海军使用。
1958年~1962年期间,中国人民解放军总参谋部也前后独立研制成功了一些自行设计、全部国产化的计算机。
1964年,中科院计算技术研究所吴几康、范新弼领导的自行设计119机(通用浮点44二进制位、每秒 5万次)也交付使用,这是中国第一台自行设计的电子管大型通用计算机,也是当时世界上最快的电子管计算机。当时美国等发达国家已经转入晶体管计算机领域,119机虽不能说明中国具有极高水平,但是仍然能表明,中国有能力实现“外国有的,中国要有;外国没有的,中国也要有”这个伟大目标。
在119机上建立的,是董韫美领导的自行设计的编译系统,该系统在1965年交付使用(Algol型),后来移植到109丙机上继续起作用。
哈尔滨军事工程学院计算机系慈云桂教授领导的自行设计的晶体管计算机441B(浮点40二进制位、每秒8千次)在1964年研制成功,骨干人员包括康鹏等人。1965年,441B机改进为计算速度每秒两万次。
与此同时,中科院计算技术研究所蒋士飞领导的自行设计的晶体管计算机109乙机(浮点32二进制位、每秒6万次),也在1965年交付使用。为了发展“两弹一星”工程,1967年,由中科院计算机所蒋士飞领导,自行设计专为两弹一星服务的计算机109丙机,并交付使用,骨干有沈亚城、梁吟藻等人。两台109丙机分别安装在二机部供核弹研究用和七机部供火箭研究用。109丙机的使用时间长达15年,被誉为“功勋计算机”,是中国第一台具有分时、中断系统和管理程序的计算机,而且,中国第一个自行设计的管理程序就是在它上面建立的。
这些由中国科研人员自力更生、努力拼搏研制出的第一批计算机,代表了中国人掌握计算机的技术水平和成果,证明了中国有能力发展自己的全部国产化的计算机事业。
突破百万到超越亿计算
虽然我国自行设计研制了多种型号的计算机,但运算速度一直未能突破百万次大关。1973年,北京大学(由张世龙培养的、包括许卓群和张兴华等骨干人员)与“738厂”(包括孙强南、陈华林等骨干人员)联合研制的集成电路计算机150(通用浮点48二进制位、每秒1百万次)问世。这是我国拥有的第一台自行设计的百万次集成电路计算机,也是中国第一台配有多道程序和自行设计操作系统的计算机。该操作系统由北京大学杨芙清教授领导研制,是国内第一个自行设计的操作系统。
1973年3月,在全国实际研制目标200~500万次不能满足中国飞行体设计的计算流体力学需要的情形下,时任国防科委副主任的钱学森,根据飞行体设计需要,要求中科院计算所在20世纪70年代研制一亿次高性能巨型机,80年代完成十亿次和百亿次高性能巨型机,并且指出必须考虑并行计算道路。中科院计算所根据国防情报所和计算所情报室提供的国际上的公开资料,分析了1970年前后美国研制的高性能巨型机的优缺点之后,于1973年5月提出“全部器件国产化一亿次高性能巨型机(20M低功耗ECL、电路-四条流水线)及其模型机(757向量计算机、10M ECL、电路-单条流水线)”的可行方案。由于文革中受到严重干扰,以及文革后“走马灯”式良莠不齐的领导乱指挥,尽管在1979年,由亚城负责的20M低功耗ECL电路的集成电路芯片投片已经研发成功,但是最终“全部器件国产化一亿次高性能巨型机”的研发,因为任务变化,最终搁浅。
表1和表2给出了代表中国掌握电子管、晶体管、集成电路计算机技术的发展时间表,水平主要是根据创新的“三性”中的先进性。需要说明的是,表中所列只是代表中国已掌握的计算机技术水平的计算机,其中,带*的103、104、119、150、757,及银河-1号巨型机和银河-2仿真计算机等7台计算机,都被载入“记述对中华文明发展起促进作用的重要历史事件”的中华世纪坛青铜甬道铭文中。
除了研制水平之外,产业、市场和应用的发展也同样重要。在批量生产计算机上,电子工业部及其相关研究所(例如著名的15所)和工厂(例如著名的738厂)功不可没。不仅上述中国早期计算机的研制和批量生产要依靠它们,而且它们也独立设计和研制过一些成批生产的计算机(例如108系列、与清华大学合作的DJS-130等),尤其在人造卫星地面系统(例如320计算机及舰上718计算机)及其他军工任务上,这些研究所和工厂都有过突出贡献。研究所和工厂研究工作的重点,主要是在技术和工艺方面。他们的领军人包括莫根生、陈立伟、曹启章及一批骨干人员,例如江学国等。现任中国工程院院士罗沛霖领导的仿IBM系列也起过历史性作用,沈绪榜和李三立负责的有关卫星天上和地上计算机及其他任务用的计算机也做出了重要的贡献。此外,七机部、清华大学及中科院各分院在发展计算技术方面还做出了许多贡献,这里就不枚举了。
中国自力更生全部国产化的半导体、集成电路计算机事业,和20世纪50~70年代林兰英、王守武、王守觉和徐元森等教授领导的中科院半导体所、上海冶金所和109厂的研究及开发工作是分不开的。中科院半导体所和109厂都是从中国科学院物理所独立出来的,中科院物理所对中国计算机事业的历史贡献功不可没。
人才培养至关重要
发展计算机事业离不开人才培养,20世纪50~70年代,中科院计算技术研究所(及之后的中国科技大学)的夏培肃副研究员、北京大学和哈尔滨军事工程学院,在组织教师和学生动手研制计算机、进行实践、培养人才等方面,都取得了很好的成绩。夏培肃领导组织教师和学生动手研制了107(定点32二进制位、每秒 250次)计算机,该计算机于1960年交付使用,并且还复制了两台。尽管107计算机比103(1958年交付使用)、104计算机(1959年交付使用)速度低了10倍到40倍,但是对培养人才起了重要作用。
一个计算机系统是由多方面研究成果构成的。范新弼领导的磁心存储器长期处于领先地位,其中主要的骨干有伍福宁、王振山、徐正春、张杰、甘鸿,等等。王克本领导了中国第一个八层印刷电路版研究与设计小组。方光旦在磁头、磁胶,张品贤在磁带,顾尔旺在磁鼓等方面,都做出了出色的贡献。实际上,大多计算机的研发都是集体成果,例如全国参加757计算机研发工作的人员,就有上千人。
我国第一个“计算机系统结构设计”小组于1957年在中科院计算所成立。20世纪50~70年代,它承担了中科院计算所代表性的计算机(119、109乙、109丙、757、717等计算机)的系统结构设计任务。参与成员则根据当时前苏联计算机领军人物、前苏联科学院列贝捷夫院士的建议,由年轻的数学专业毕业生组成。第一任小组负责人是国际网络权威人士闵乃大教授,第一个正式设计任务则是1958年5月国防部门的“导弹防御系统计算机”系统结构设计。设计工作由北京大学张世龙和第二任小组负责人虞承宣,加上6名数学专业毕业的大学生组成,其中周巢尘、沈绪榜等3人后来分别由不同领域(软件、航天、系统结构)、不同单位被选为中科院院士。
中国20世纪60年代编译系统的带头人在当时都是年轻人,如中国人民解放军总参谋部杨奇、中科院计算所董韫美和仲萃豪、南京大学徐家福、国防科技大学陈火旺等。中国20世纪60年代操作系统的带头人有北京大学杨芙清、南京大学大孙仲秀等,当时也都是年轻人。软件正确性设计(容易推广到硬件的正确性设计)是近20多年国际上关注的具有巨大经济效益、社会效益和理论价值的重大问题。我国领军人物何积丰院士、周巢尘院士如今已经是国际上知名的佼佼者。20世纪70年代,逐渐形成容错和检测理论和实践的带头人是魏道政,而知识处理的带头人是陆汝钤。
依赖进口弊端过大
20世纪70年代后期以后,中国研制的计算机,几乎全部使用进口元器件、进口部件。
由于超大规模集成电路迅速发展,数千万甚至上亿个晶体管逐渐能够集成在一个芯片上,20世纪80年代及其之后得到迅速发展的计算机,是普通个人使用的“微机”(PC机)及超强“微机”(后者可以组成服务器或者并行处理的高性能计算机),而其他各式各样的计算机(包括超级中小型计算机在内)由于性价比问题,无法和微机竞争,就自然逐步退出舞台了。国际上没有及时调整战略的计算机公司,例如CDC公司、王安公司等,纷纷倒闭。虽然如此,国内那一段过渡时期为了满足用户需求而研制的各种机型也曾有过较大贡献,例如张修领导的KJ8920,在为用户提供优质服务软件方面就很突出。
中国最早意识到个人计算机发展趋势而率先转向研究“微机”,并且做出突出贡献的带头人有倪光南、韩承德等。
国内高性能计算机,有慈云桂、卢锡城、周兴铭、杨学军领导的银河系列;张效祥、金怡濂、陈左宁领导的神州系列;李国杰、孙凝晖领导的曙光系列;祝明发领导的联想深腾系列;以及周兴铭领导的银河-2数字仿真巨型机等。PC机有联想系列、长城系列、方正系列、同方系列等,其学术代表性带头人是倪光南,产业代表性的领军人是柳传志。
计算机产业作为一个产业链,软件发展依赖于整机和应用需求的发展;整机的发展依赖于芯片、部件及需求的发展;芯片的发展则依赖于“集成电路生产线大三角形”的发展。这里集成电路生产线大三角形是指集成电路生产线的三大部分,即大底座、中间层和顶层。大底座(价值十多亿美元的集成电路制造工艺生产线)是从拉单晶硅到光刻-扩散-参杂,到最后封装,相当于过去林兰英、王守武、王守觉和徐元森等领导中科院半导体所、上海冶金所的研究工作。中间层是各种高速低功耗电路设计,相当于过去中科院计算所电路设计组蒋士飞、沈亚城等人的研究工作。20世纪70年代,沈亚城所进行的高速低功耗ECL电路设计,直到做成芯片,才可以算做完成。顶层则是硅编译等等软件工作,这部分工作过去是计算所使用小规模集成电路时把逻辑设计图变成为工程布线图的手工工作,加上半导体所制造小规模集成电路各种掩模版所需的手工工作。在超大规模集成电路的情况下,从复杂性、可靠性角度,手工是绝对不可能完成的,需要依靠硅编译来自动完成。
在允许部分进口的环境下,一个产业链如果要求全部国产化,会造成一环落后引发产业链后续部分全部落后的情况;使用进口元器件、进口部件,使得各种类型整机可以在国际先进基础上得到发展,进而软件和应用都能在国际先进基础上得到发展,从市场经济角度看,这无疑是正确的。
但是,当国内所研制的计算机全部转向使用进口元器件、进口部件时,一方面中国的高性能计算和PC机的发展依赖于进口元器件和进口部件的水平;另一方面中国的集成电路研制力量,由于缺少巨大的经济支持,都转向非计算机用的其他难度小的方向。
“元器件全部进口化”导致的结果是,不仅全部国产化的亿次高性能巨型机研制中止,而且真正完全自主的国产的计算机集成电路研制工作也中断,至今也没有恢复,甚至没有任何恢复的迹象,这两方面对国家安全都很不利。实际上,“集成电路生产线大三角形”依靠进口的集成电路生产线,就等于依赖外国集成电路生产线水平和外国政府批准向中国出口的集成电路生产线的水平。引进无法达到最先进,而且在特殊情况下,引进很可能中断,引进的生产线的备份件也不能得到更新。
“中国芯”何时真正崛起
进入21世纪以后,李德磊负责的“方舟”、胡伟武负责的“龙芯”、以及王沁参加负责的“多思”、方信我负责的“国安”等等“中国芯”项目不断涌现,计算机产业链国产化又前进了一大步。但当前或者未来将出现的众多的“中国芯”的共同点,都是“集成电路生产线大三角形”的一个应用。也就是说,其水平仍然是依赖于外国集成电路生产线水平和外国政府批准向中国出口的集成电路生产线的水平,仍然受制于人。
众多“中国芯”的主要的差别只是在系统结构设计上,或者在高速低功耗电路等设计上,有没有重大创新、重大突破。设计明显创新的,有国外学者称之为相当于“大学生课程设计”水平,虽然难听却也有几分道理。尽管能设计“中国芯”的人或公司越来越多,但是能设计“中国集成电路生产线大三角形”的人,如果不采取措施,不仅没有,恐怕不远的将来仍然是空白。如果中国不能制造中国的“集成电路生产线大三角形”,那么无论有多少种“中国芯”,中国的高性能计算机和中国PC机的发展水平就必然还是取决于美国“集成电路生产线大三角形”的发展水平及美国政府允许向中国出口的水平。
现实的道路是,我们可以通过引进、消化、吸收与独立研究相结合的方式发展芯片产业,而建立完全自主的“集成电路生产线大三角”,则应该是国家急需解决的重中之重。
早在1965年,中科院半导体所王守觉就开始研制从逻辑图到掩模版的自动形成系统“图形发生器”,这项研究比美国还早。由于文革破坏而中断了3年,1971年初研制成功时,反而比美国晚了一年多。以上历史说明,中国人的独立研究能力也不容忽视,研究环境也不容被忽视。
如何做到既能使产业链的各个环节的发展都能建立在国际最高水平之上,又能确保国家安全?这不仅仅是一个计算机产业链的问题,应该是许多产业链所存在的共同问题,更是决策者急需处理的政策问题。
中国半个世纪电子数字计算机事业的领路人,是在两位共和国功勋科学家华罗庚和钱三强关注下的一个群体,这个群体在50年前,是10多名从相邻领域转过来的30~40多岁的中青年带头人,和五、六十名受过专业教育的20多岁的青年骨干,还有数十名当时尚未出世的后起之秀,本文列举的,只是这个百人群体中的一小部分。
链接:文中部分科学家简历
华罗庚:江苏金坛人。中国解析数论、典型群、矩阵几何学、自守函数论与多复变函数论等很多方面研究的创始人与开拓者,国际知名数学家,先后当选美国科学院外籍院士,第三世界科学院院士,法国南锡大学、美国伊利诺大学、香港中文大学荣誉博士,联邦德国巴伐利亚科学院院士等。
钱三强:浙江湖州人,出生于浙江绍兴。核物理专家、中国核原子科学之父,曾师从居里的女儿、诺贝尔奖获得者伊莱娜?居里及其丈夫约里奥?居里。在中国研发原子弹期间,担任技术总负责人、总设计师,被追授“两弹一星功勋奖章”。
范新弼:电子计算机专家,湖南长沙人。1951年获美国斯坦福大学电子学博士学位,在电子器件研究与应用领域获8项美国专利。归国后,领导我国第一台大型计算机及其后多台大型计算机的磁芯存储器研制工作,领导中国半导体存储元件研究,建立了国内第一批测试设备。
张效祥:计算机专家、中国科学院院士(学部委员)、中国解放军总参谋部计算技术研究所研究员。领导中国第一台大型通用电子计算机的仿制并在此后的35年中主持中国自行设计的电子管、晶体管到大规模集成电路各代大型计算机的研制,为中国计算机事业的创建、开拓和发展,起了重要作用。1985年,领导完成中国第一台亿次巨型并行计算机系统。
钱学森:中国现代物理学家、世界著名火箭专家、全国政协副主席,浙江杭州市人,生于上海。钱学森曾在美国任讲师、副教授、教授以及超音速实验室主任和古根罕喷气推进研究中心主任。1950年开始,历经5年努力,于1955年才回到祖国,1958年起长期担任火箭导弹和航天器研制的技术领导职务。
董铁宝:力学家、计算数学家,江苏武进人,“中国第一个程序员”(王选),长期致力于结构力学、断裂力学、材料力学性能、计算数学的研究和教学,我国计算机研制和断裂力学研究的先驱者之一。1945年赴美学习,1956年归国教学,1968年在文革中因受迫害自杀。
金怡濂:中国工程院院士、著名高性能计算机专家、国家最高科学技术奖获得者,原籍江苏常州。中国第一台大型计算机研制者之一,先后提出多种类型、各个时期居国内领先或国际先进水平的大型、巨型计算机系统的设计思想和技术方案,为我国高性能计算机技术的跨越式发展和赶超世界计算机先进水平有着重要贡献。
王选:江苏无锡人。著名的计算机应用专家,主要致力于文字、图形、图象的计算机处理研究。中国科学院院士、中国工程院院士、第三世界科学院院士、国家最高科学技术奖获得者。曾任北大方正集团董事、方正控股有限公司首席科技顾问,九三学社副主席、中国科协副主席、九三学社副主席、中国科协副主席。2003年当选十届全国政协副主席。
周巢尘:计算机软件专家,原籍江苏南汇,中国科学院院士(学部委员)、第三世界科学院院士、中国科学院软件研究所研究员,曾任联合国大学国际软件技术研究所所长。
杨芙清:北京大学计算机学科第一位教授、博士生导师,中国科学院院士(学部委员)、计算机科学技术及软件专家,无锡人。历任软件工程国家工程研究中心主任、北京大学信息与工程科学学部主任、北京大学软件工程研究所所长、北京大学计算机科技系教授。
孙仲秀:计算机科学家、中国科学院院士,原籍浙江余杭,生于江苏省南京市,历任南京大学助教、讲师、副教授、教授、博士生导师、副校长等职。1974年后主持研制了中国国产系列计算机DJS200系列的DJS200/XT1和 DJS200/XT1P等操作系统。从1979年起开始对分布式计算机系统软件和应用进行了研究,1982年在国内首次研制成功ZCZ分布式微型计算机系统,研究和开发了多个实用的分布式计算机系统。
何积丰:中国科学院院士、计算机软件专家,生于上海,祖籍浙江宁波。现任华东师范大学终身教授、软件学院院长,上海嵌入式系统研究所所长、联合国大学国际软件技术研究所高级研究员。早年进行管理信息系统和办公自动化系统的研发。
吴几康:安徽歙县人。计算机专家、中国计算机事业的开拓者之一。曾于1951年至1953年在丹麦任无线电厂开发工程师,归国后调至中国科学院近代物理研究所,后参与筹建计算技术研究所。1965年负责研制成功两台大型通用计算机,后参与筹建771微电子学研究所,任副所长和研究员。
张梓昌:电子计算机专家。江苏崇明(今属上海市)人。历任航天工业部第二研究院所长、测控公司总工程师,中国计算机学会第一届副理事长,中国宇航学会第一、二届理事。长期从事电子设备和计算机的研制,曾负责我国第一台计算机的技术工作,是我国计算机技术的学科带头人之一。
张世龙:北京大学计算机科学与技术系主任、教授,曾参加我国第一台自行设计制造的大型计算机119机和北大红旗计算机的系统设计。
慈云桂:著名计算机科学家、教授,中国科学院技术科学部学部委员,安徽桐城人。历任国防科技大学副校长兼电子计算机系主任和计算机研究所所长等职,先后主持了我国多种型号计算机的研制,从领导研制我国第一台电子管数字计算专用机,到担任“银河”亿次计算机研制的技术总指挥和总设计师,为国家经济建设、国防建设及科学研究事业做出了突出贡献。
冯康:应用数学和计算数学家、中国科学院院士、世界数学史上具有重要地位的科学家。生于江苏南京,原籍浙江绍兴。其独立创造了有限元方法、自然归化和自然边界元方法,开辟了辛几何和辛格式研究新领域。中国现代计算数学研究的开拓者。1997年底国家自然科学一等奖授予冯康的另一项工作“哈密尔顿系统辛几何算法”。历任中国科学院计算技术研究所任副研究员、研究员,中国科学院计算中心主任、名誉主任。(排名不分先后)

关于中国计算机和互联网产业的观察和想法

我在中国待了一年多了,更有了解了,最近有空也读了一些关于计算机发展史的资料,之前未知的是其实英国在计算机行业刚开始可能更领先,还有纳粹德国的Konrad Zuse也搞出了Z3,Z4等电子计算机,比美国的早,当然美国1945出来的ENIAC应该是更好。无论如何,纳粹的技术再强,他们最终是战败国,所以他们的影响和得到的认可必然是有限的。

我的一个出生美国但反感美国的朋友,他父亲八十年代去美国的,美国籍,零几年回国发展现在为上市技术公司老板,跟我说中国的计算机和软件行业是极其崇美的,所我这样的人在这个行业难以得到认可,觉得我这样的人自然对那些留美和崇美的人是威胁,至少会让他们感到非常不舒服。

显然,因为计算机编程语言都是用英语的,关键词用英语,变量命名也用英语,文档好多都是用英语,所以自然更受美国的影响。硬件行业在中国就没这个问题,好多硬件行业的英语知道很少的人在中国也混得很好,在该行业很有影响力。

我待在的公司好多程序员都翻墙用谷歌和Gmail,尽管公司给体制内敏感部门服务。我倒没有用谷歌,基本用百度,bing,yandex,觉得跟谷歌没啥区别,需要的信息基本都能找到,只有一次我才用了谷歌找到了其它搜索引擎没法找到的,好像是关于kubernetes(其为谷歌的产品)的墙的问题,然后它有kubernetes自己的程序了help的文档,也更加让我意识到其实用man, -help之类是更专业的做法,不要过于依赖搜索引擎。

其实,软件这种东西,是越用它得到的反馈和数据越多,他才能变得越好。谷歌排名反prc不光是内部的黑操作,还有因为墙,用它的偏美国华人和港台人,这些人都是经过很强的自我政治筛选的,他们点的关于中国政治的结果自然得到更多正反馈,则被排的更靠前。还有,谷歌搜索引擎都把中国大陆网站排在后面,一位美国名校毕业竞赛得过最高奖的人到中科院工作,谷歌尽然没有把他的尾为.cn的网页包含在结果里。

美国推特上的dukeofqin赞了中国的墙,他的说法我完全同意,我觉得他这么说没什么争议的,因为效应非常明显,他也提到了中国人用英语跟西方人争论是个自然输的游戏,相当于一个12岁的孩子跟24四岁的拳击运动员进行“公平竞赛”。以下为内容,欢迎人帮我翻译一下,可以把翻译发到我的邮箱。

The Great Firewall was one of China’s most forward looking policies and resulted in the development of an entire ecosystem of domestic internet companies found basically nowhere else. The idea that it’s removal would be fighting the global misinformation war on equal footing is patently absurd because the majority of Western media companies are de-facto US government owned organizations which has total gate keeper control over who goes in to the system. In addition, requiring that the Chinese fight misinformation in English is again a non-starter simply because language proficiency issues means that any kind of argument conducted in English would immediately disadvantage the Chinese. This is akin to demanding a 12 year old fight a 24 year old boxer in a “fair fight”. The fairness being only in the confrontation and disregarding the base levels at play. If the Western liberasts had any balls, they would challenge the Chinese on Zhihu and Douban, but a tiny insignificant China hands capable of doing so inevitably end up running for the hills, being regularly out trolled by the native speakers or just as quickly get banned. There is nothing stopping Westerners from going inside the firewall to debate the Chinese, they are unable to do so, so they instead demand that the Chinese surrender the high ground and volunteer themselves to be surrounded. In addition, it is plain as day that the ostensible freedoms of Western social media are rapidly vanishing under a tide of government misinformation, corporate compliant shadow bans, “ngo” bot campaigns, algorithmic tweaking, search obscuration, etc all designed to reinforce a status quo that the Western states momentarily lost control of due to the internet originally bypassing the traditional gate keeping networks that keeps all mass media organizations playing the same tune. The reason that Tik Tok is going to be banned in the US has nothing to do with security nor reciprocity, it is simply because it isn’t a US government controlled media company, thus the tools it has in it’s arsenal for “curating” the consensus are not under US government control. This is it’s biggest crime.

中国在互联网行业是摆脱了美国的垄断,可以其用的核心技术大多都是美国的,芯片不用说,还有操作系统,编程语言,好多可信开发系统和框架。搞这些东西难赚钱(跟广告完全不一样),所以很少私企在中国搞这些,就直接用美国的。

我小时候还记得在母亲的办公室玩当时的Windows 95的solitaire(单人纸牌戏),好多我妈的同事闲的时候却玩那个,那时候是97年吧。那个时代苏联解体了,美国刚搞出gps导航系统,算在它的顶峰期,好多中国人都就得美国牛逼不得了,都抢着到美国跑,我妈也是一样。那时候中国人把微软看成为多么不得了的东西了,崇拜比尔盖茨。

在那个年代互联网刚开始进入中国,即使在美国那时候好像有个搜索引擎叫alta-vista质量也很一般的,它谷歌起来后倒闭了。中国在计算机行业除了少数体制内军工企业处于一种低谷。中国出的竟是像联想这样的买办计算机组装厂,当时还忽悠了很多中国人。

其实在70年代中国计算机技术并没那么落后,当然的确80年代90年代美国在这个个人电脑上占了大的上峰。我读到80年代在苏联个人计算机是一般人一年还是两年的工资的钱才能买到的。我也记得一个苏联人说美国的很大的优势是微电子,美国把微电子大批量生产成本降低了,相反,苏联尽管能生产最好的微电子但是他们在供应商有一定的短缺,大多还是科技研发机构才能用的起。而且80年代的时候在软件上,也是美国遥遥领先了。当然,网上写了苏联(我相信中国也是)也开发过一些编译器(比如为了fortran)和操作系统,大多都是给科技研究机构用的。

我爸跟我说改革开放其实破坏了不少中国的微电子半导体和计算机产业,中国在那方面基本跟着美国走了,没有做多少自己的研发,或者研发也都是基于美国核心技术的应用。

龙芯倒是00年起开始搞它自己的生态了,但那时候windows在中国已经扎根了,有人说要国产化,这个我觉得怎么也得需要十年时间吧。所以龙芯赚钱也只能靠卖给国企一些特殊的不需要庞大软件生态的芯片。更多国人应该了解,现在其实搞出个过得去的CPU并没有那么那么难,当然你做出来了基本保证没人会用,因为没有配套的应用软件啊。

其实中国互联网企业的发展还是受到了很大的中国的语言的保护,毕竟中文是个很大的屏障,这使得美国公司互联网很难打进中国市场。他们培养的买办在自己的组织能力以及他们在中国的联系,接地气等都是明显劣势的,他们更美国那边沟通效率也是很低的,而且那类人自然就是自私自利不团结的那种,作为一个群体很难成大事。他们可能更有钱,可是他们的钱到实际价值的转化率要比土鳖派低的多得多。就像当年国民党跟共产党大战,国民党组织和沟通效率就是极低的,内部乱,然后还受制于美国,所以即使有了优越的装备也是惨败。

美国的计算机行业比较瞧不起中国,尤其是软件。中国的墙给了很不好的印象,加上中国在核心软件产品比如开发工具,编程语言,核心的程序库和框架对世界开发社区的贡献是极小的,被视为一个搞封闭互联网偷技术在中国克隆美国互联网产品本土化的贼。去美国的搞计算机软件的华人在那个领域也更难融入其主流,因为在美国的软件行业会说话会扯淡的能力相对更重要一些。

在中国的互联网行业,不少人尽然把谷歌和脸书的经历看的高大上,尽管那俩公司是跟中国主流完全对立的,基本在中国政府的黑名单上。我在那里待过,知道他们怎么回事儿,好多人都很一般,氛围也比较反prc,大陆移民大多是老老实实地听美国的话,跟美国走。回到中国他们把那些地方形容的非常高大上,为了维护自己的利益,希望利用谷歌脸书背景得到投资等。

所以中国互联网行业亲美势力较大,这个问题难解决,首先那些人已经得势了,加上这个领域自然吸引一种小资鼠目寸光的性格,自然会为了点小钱小利益做一些可疑的事情。这一点没有像十年前那么严重了,但依然很严重。所以我觉得中国的墙做的还不够,需要对那些自愿获得美国的学位或浓厚美国经历的中国多加限制,让他们知道他们可以做选择,但是必须得为他们的选择承担责任。

去美国留学或者搞技术的中国人经常很幼稚,他们只看到了可以从美国讨到钱,从美国学位讨到好处,从来不会想在中国主流,美国学位是不受欢迎的,有了美国学位就不可能进入中国的统治阶层。而且,他们在美国也属于政治贱人的地位。他们当时比较短视,只看到了短期的利益,没有看到更宏观的社会和政治格局,我相信他们自然会被现实所惩罚。

其实,中国的土鳖派想让那帮留美海归在中国很难混有了一定的组织,方法和中国当权派的支持真的不难,当然,这个需要过程,需要时间。不要认为那些人相对有钱就多么有实力,其实他们不算啥,中国的政治气候完全不向着他们,他们本质上是不受欢迎的,很多没有美国经验的或像我这样小时候被迫去美国的人都可以公开骂他们,他们也不能怎么样,因为他们在中国的比例是非常之少数的,而且他们在中国的体制内,核心统治阶层几乎是不存在的。

陆奇被微软开掉了(我当时傻,还真的以为出了自行车事故,如媒体报道,是个微软内部的人跟我说的),他回到中国看来也水土不服,搞个ycombinator中国代理人也没成。他的孩子完全都是美国人,如果我特别想联系到他们都有可能,比较算认识微软高层的移民华人认识他们。张亚勤也是孩子都在美国上学,在美国我有一次跟一些人吃饭其中都有他老婆,可能都跟她说了几句吧。反正这样的人在中国肯定是会受限制的,默认不是那么被信任。

最近得知沈向洋也要离开微软了,估计也是被迫而离的。他达到了直接汇报给微软ceo的级别。我觉得这些人的好时光基本过去了吧,他们的孩子在美国也没有多么好的未来,在中国他们基本更不可能有前途,中文完全不过关,也很难过关,这些我有亲身经历,那些人和他们的孩子我不是无接触。

所以有人说改革开放培养了好多人是非常给自己挖掘前辈留下的财富,然后把负担都留给后代。陆奇,沈向洋,黄学东这些人跑到美国基本都是这样的。他们能够有短期的繁荣,可是他们无法将其传给后代(尤其是中国的后代,而非仅仅他们自己的家的后代),给自己的孩子留下一些钱是,但是扔掉的是他们最宝贵的社会和文化关系,钱有了一点的背景是可以快速积累的,但社会和文化关系是很难或几乎不可能的。

关于计算机史的一些资料(Некоторые сведения об истории вычислений)(Some information on computing history)

内容推荐,协同过滤

这套东西我没有直接做过,但我估计应该不难吧。我曾读过Trevor Hastie和Robert Tibshirani的Introduction to Statistical Learning的一些部分,也做过其中的一些习题,因为好久没碰,内容记得也不太清楚了。反而现在发现好多相关的中文名词我不知道,比如统计显著性就是Статистическая значимость,以及好多线性代数里的中文名词,比如奇异值分解就是Сингулярное разложение。还有什么共轭矩阵самосопряженная матрица),这些得慢慢积累,如果要在中国工作。从这个就更能认识为什么美国学位在中国有他的问题了。

现在在中国上英文有他的限制,自然会先看中文的内容。查到了如

https://www.cnblogs.com/NeilZhang/p/9900537.html

https://blog.csdn.net/nicajonh/article/details/79657317

https://blog.csdn.net/hlang8160/article/details/81433356

https://www.cnblogs.com/guoyaohua/p/9240336.html

这里面的内容大概看了,我在这里就把它们的一些要点记录一下吧。因为这些内容好多我学了不用也就忘了,比如那个什么td-idf。

这个的构建看一下不难理解,比如

tf(t,d) = \frac{n_t}{\sum_k n_k}.

n_t是词t的出现次数,分母的和显然是文档里的词数。

然后idf为

2019-12-25 下午7.33.01

这个的设计逻辑也很简单,就是那些经常出现的词,如the,a出现多了也是正常,所以这种在一个文档里的重要程度必须与它的总频率相比而衡量。

有一次我被问过一个问题,那就是推荐系统怎么实现“相关内容”的推荐。这是好几年以前,我当时傻还回答了简单用个条件概率。可是这个很明显是不可成立的。因为在很多分类中(比如人的分类),少数会得到极大的关注,有些可能大部分用户都查过,比如“范冰冰”。如果用那种方法就会无论如何都推荐那些名人。所以在这种情况我们也可以用一个类似于tf idf里的分母。

tf idf可以用于做分类。

然后我看了看word2vec的内容,这个训练模型的思路很简单。他根本目的是用一个词的上下文里出现的词(限于一个文集(corpus))给词定一个向量,则两个相同的词,比如“国王”和“黄帝”之间的余弦距离(cos距离)就会比较高。

训练时,词向量的维度和上下文的长度是可以调的。训练用的都是one-hot vector,训练的参数是那些权重(该权重矩阵将词的one-hot vector转到它的词向量),然后还有个softmax层(这个就是个多逻辑回归),然后每一个训练样本的也是输入为一个词的one-hot vector,然后其词上下文里出现一个词的one-hot vector。

关于word2vec,还可以参考

https://neurohive.io/ru/osnovy-data-science/word2vec-vektornye-predstavlenija-slov-dlja-mashinnogo-obuchenija/

来自其的图片

Финальная модель embedding

就是一个很简单的两层的神经网络。

Duke of Qin on the Great Firewall of China

The Great Firewall was one of China’s most forward looking policies and resulted in the development of an entire ecosystem of domestic internet companies found basically nowhere else. The idea that it’s removal would be fighting the global misinformation war on equal footing is patently absurd because the majority of Western media companies are de-facto US government owned organizations which has total gate keeper control over who goes in to the system. In addition, requiring that the Chinese fight misinformation in English is again a non-starter simply because language proficiency issues means that any kind of argument conducted in English would immediately disadvantage the Chinese. This is akin to demanding a 12 year old fight a 24 year old boxer in a “fair fight”. The fairness being only in the confrontation and disregarding the base levels at play. If the Western liberasts had any balls, they would challenge the Chinese on Zhihu and Douban, but a tiny insignificant China hands capable of doing so inevitably end up running for the hills, being regularly out trolled by the native speakers or just as quickly get banned. There is nothing stopping Westerners from going inside the firewall to debate the Chinese, they are unable to do so, so they instead demand that the Chinese surrender the high ground and volunteer themselves to be surrounded. In addition, it is plain as day that the ostensible freedoms of Western social media are rapidly vanishing under a tide of government misinformation, corporate compliant shadow bans, “ngo” bot campaigns, algorithmic tweaking, search obscuration, etc all designed to reinforce a status quo that the Western states momentarily lost control of due to the internet originally bypassing the traditional gate keeping networks that keeps all mass media organizations playing the same tune. The reason that Tik Tok is going to be banned in the US has nothing to do with security nor reciprocity, it is simply because it isn’t a US government controlled media company, thus the tools it has in it’s arsenal for “curating” the consensus are not under US government control. This is it’s biggest crime.

screenshot-twitter.com-2019-12-24-19-42-59-039

По-русски через Яндекса переводчика

Великий Брандмауэр был одним из самых передовых стратегий Китай смотрит и привело к созданию целой экосистемы отечественных интернет-компаний найдено в принципе нигде. Идея о том, что это удаление будет бороться с глобальной дезинформации войны на равных условиях, является абсурдной, поскольку большинство западных медиа-компаний де-факто нам государственных организаций общего управления воротами хранитель, который идет в систему. Кроме того, требование, что китайская борьба дезу на английском языке снова за бортом просто потому, что вопросы владения английским языком означает, что любой аргумент проводиться на английском будет сразу минус китайцы. Это сродни требуя 12-летний бой 24-летнего боксера в “честном бою”. Справедливость только в противостояние и игнорирование базовых уровней в игре. Если западные liberasts было никаких шаров, они будут конкурировать с китайцами на Zhihu и Foursquare, но совсем незначительные Китай руками способен сделать так неизбежно в конечном итоге работает на холмах, регулярно из тролем с носителями языка или просто как быстро банили. Ничто не мешает западникам от идти внутри брандмауэра для обсуждения китайцев, они не в состоянии сделать это, так они вместо того чтобы требовать, что китайцы сдала высоту и добровольно себя окружать. Кроме того, это ясно как день, что якобы свобод западных социальных медиа стремительно исчезая под волной дезинформации правительства, корпоративных уступчивый тень запреты, “НПО” СЭП кампаний, алгоритмической Настройки, Поиск обскурации и т. д. Все это призвано укрепить статус-кво, что западные государства, на мгновение потерял управление из-за интернета изначально минуя традиционные ворота учета сетей, который держит все СМИ играют одну и ту же мелодию. Той причине, что тик ток будет запрещено в США не имеет ничего общего с охраной, ни взаимности, это просто потому, что это не правительство США, СМИ, контролируемые компанией, таким образом средства она имеет в своем арсенале для “курирования” консенсус не под контролем правительства. Это большое преступление это.