C#首席设计师Anders Hejlsberg专访（1）转

2022-07-15 80酷酷网 80kuku.com

　　设计作者：John Osborn

译者：荣　耀

[译序：精彩技术，不容错过！限于时间和能力，译文倘有讹误，当以英文原版为准。]

7月，O’Reilly 编辑John Osborn参加了微软职业开发者会议。在此，他对著名的工程师、微软.Net框架设计师、C#程序语言首席设计师Anders Hejlsberg进行了采访。Anders Hejlsberg因设计PC上最早的语言之一—Turbo Pascal而出名。他把Turbo Pascal授权给Borland公司，后又率队开发了Delphi—一个极为成功的可视化的客户/服务应用设计工具[译注：此处不必拿MIDAS之类较真J]。访问时在座的还有微软C#产品经理Tony Goodhew和O'Reilly的Windows编辑Ron Petrusha。

Osborn:

     我已经看到一些关于C#[发音为"See sharp"]的新闻故事，我注意到有很多似乎倾向于这样的观点—或理论上说—C#不是Java的克隆就是Java的微软替代物。如果你来写这个标题，你希望人们怎么评论这门语言？

Hejlsberg:

     首先，C#不是Java的克隆。在设计C#期间，我们考察了很多种语言，如C++、Java、Modula　2、C、Smalltalk等。很多语言都有我们感兴趣的相同的核心思想，比如深度面向对象、简化对象等等。

     C#和这些别的语言尤其是Java的关键不同点是它非常接近C++。在我们的设计中努力使然。C#从C++直接借用了大多数的操作符、关键字和声明。我们还保留了许多被Java抛弃的语言特性。为什么Java中没有枚举，道理何在？我的意思是，抛弃它们是基于何种理论基础？在C++中，枚举显然是一个很有意义的概念。在C#中，我们保留了枚举并同样使其类型安全。并且，枚举不只是整型，它们实际上是从.NET基类库里的System.Enum派生下来的强类型的值类型。如果没有造型转换，枚举类型“foo”和枚举类型“bar”不可互换。我认为这是个重要的差异。我们还保留了操作符重载和类型转换。C#名字空间的整体结构也非常接近C++。

     但是，超越这些传统的语言论题，我们设计语言的一个关键的目标是使C#面向组件。我们向语言自身加入了你在编写组件时所需要的所有概念。例如属性[译注：即property，翻译为“属性”，由来已久。我怀疑如果先有attribute的话，property会不会被翻译为“性质”、“特性”，而attribute才是“属性”:JL]、方法、事件、特性[译注：即attribute，截至目前，此名词译法仍较混乱。有的翻译和property不区分，也译为“属性”；有的译为“特性”；有的译为“属性信息”。在该名词译法尚未统一之前，本着精简原则，笔者先把它翻译成“特性”。但注意，XML中的attribute的译法一般比较统一，即为“属性”（因为XML中没有一个类似于property的东西会与之混淆）。因此，本文最后交叉描述C#和XML的部分，请留心“特性”、“属性”各有所指。]和文档等，它们都是一流的语言结构。我们对特性所做的工作是全新的和创新的。利用特性可为任何对象加入有类型的、可扩展的元数据。这在目前任何其它程序语言里都看不到的。C#也是第一个合并XML注释标记的语言，编译器可以用其直接从源码中生成可读的文档。

     另外一个重要的概念是我所说的“一站购物式软件”[one-stop-shopping software]。一旦你用C#写代码，你就在这一个地方写了一切。不再需要头文件、IDL（接口定义语言）文件、GUID和复杂的接口。因为它是自包容的单元。一旦用这种方式写自描述的代码，你就可以把你的软件嵌入到ASP页面或植入各种不同的环境，这在以前是不可能的。

     但是让我们再回到组件这个重要的概念。语言是否应该支持属性或事件，业界有很多争论。没错，我们是可以用方法表达这种概念。我们可以用诸如“get”或“set”之类的程序块的命名模式模拟属性的行为。我们可以用接口和实现接口的适配器并转发到对象。这都是可能实现的，就象可能在C语言里进行面向对象编程一样。只是它太困难了，需要太多的手工劳动，为了表达你真正的思想，你最终不得不去做所有的工作。我们认为是时候了，应该有个语言使得创建组件变得容易些。今天程序员在创建软件组件。他们并不是创建整个应用或整个类库。每个人都是在创建从宿主环境提供的基组件继承下来的组件。这些组件重载一些方法和属性，它们处理一些事件，并把组件安装回系统。树立这些概念是关键的第一课。

Osborn:

     你最近在介绍C#时，第一张幻灯片上面写着：“C/C++家族里第一个面向组件的语言”。

Hejlsberg:

     是的。这是我的首要目标之一。我们谈论一切如何都是对象，这也非常关键。以前象Smalltalk和Lisp语言都可以这么做，但代价昂贵。我认为C#包含一些优美有趣的创新使得组件开发容易些。例如装箱和拆箱的概念。装箱可以使一个值类型的值转换为一个对象，拆箱可以使一个对象转换为一个简单类型的值。这在以前或许也有，但我们把它应用于语言的方式是一种优美的创新。

     我们努力避免用“象牙塔“的方式设计C#和.Net框架。我们承受不起重写我们所有的软件的负担。业界也负担不起，特别是今天我们正转移到Internet时代。你要善于利用你已经拥有的。所以，我认为互操作性也是关键的。我们致力于为程序员提供所有符合Internet标准的可互操作的正确的解决方案，例如HTTP、HTML、XML以及微软已经存在的技术。所以你不会有如坠深渊的那一刻—发现新的.NET框架下没有提供你用的一些东西，或者你意识到你想利用一些已经存在的API或组件的时候。你已经看到我们已把所有COM的互操作能力内建入语言和公共运行时；你已经看到可以使用DllImport特性导入已存在的DLL[动态连接库]；你已经看到即使那些都不能遂你愿，我们也有不安全代码的概念。不安全代码允许你写使用指针的内联C代码，可以做不安全的造型转换，可以抑制内存从而使其不会被意外地垃圾收集[译注：此处用作动词J]。

     关于不安去代码有很多争论，人们似乎认为我们在吸毒或是在干什么别的坏事。我认为这是个误会。代码不会仅仅因为标记了“不安全”就表示它不受管制。当然，我们不会扔出不安全的指针使人们容易受到从Internet下载的不安全代码的攻击。不安全代码被深深地约束在安全的环境里。我们提供这样的弹性：1.呆在受管制的代码箱里完成工作而不会坠入深渊；2.转入一个不同的语言使用一个不同的编程模型写本地代码。如果你停留在这个箱子里，我们会使代码更加安全，因为系统知道它要干什么。事实上，即使你写不安全代码也不意味着你离开了受管制的空间。你的不安全代码会变得更有效率。

Osborn:

     请给我多讲一些在受管制的环境里处理不安全代码的机制。

Hejlsberg:

     好的。描述受管制的执行环境比如Smalltalk、Java和.NET公共语言运行时一个重要特征是它们提供垃圾收集机制。为了提供垃圾收集机制，至少要提供一个现代的垃圾收集器，一个“标记和清扫”垃圾收集器。比起传统不受管制代码来说，你必须更多地了解正在执行的代码。为了找出要排除的死对象，你必须能遍历堆栈，找到所有活动的根，并指出哪些对象是活动的哪些是不再被访问的。然而，为了能够达到这个目标，你必须和你执行的代码紧密协作。代码必须具有更好的描述性。它要告诉你它是怎么分布在堆栈里的，它的局部变量存放在何处等等。

     当我们在C#中编写不安全代码时，你可以做不是类型安全的事，比如指针操作。标记为不安全的代码并非绝对执行在不可信任的环境里。为了使之执行，你必须授予信任，否则，代码将不会执行。从这一点来看，和其它本地代码并无区别—真正的区别是它们仍然运行在受管制的空间里。你写的方法有一个描述表，它告诉你哪些对象是活动的，因此，不管什么时候你进入这些代码，你都不必穿越列集边界。否则，当你进入非描述性的、不受管制的代码（比如通过Java本地接口），你不得不在堆栈上设置一个水印或设置一个屏障。你必须重新列集所有箱子外的参数。一旦开始使用对象，你必须对你触及的东西小心翼翼，因为GC[垃圾收集器]仍然在另一个不同线程里运行。如果你不使用一些隐晦的方法锁定对象从而正确地抑制垃圾收集器，它可能会移去对象。如果你忘记那么做，那你将会不走运。

     我们采用了一个不同的方式。我们说过，“让我们集成这个到语言中去。让我们提供声明，例如fixed声明，它可以让你抑制对象以和GC协作并集成之。”用这种方法，我们提供最佳方式，带领所有已经存在的代码一起向前，而不是仅仅将它们抛弃。这是一个不一样的设计方式。

Osborn:

     因此，你们对不安全代码的处理方式是—不安全代码的内存实际上是在垃圾收集器的监视之下？

Hejlsberg:

     是的。但是，就象所谓的“购者自慎，不包退换”一样，它并不安全。你可以获取指针并做错事—当然，你在本地代码里也能干同样的错事。

Osborn:

     我认为另一个易混淆的地方，是理解C#在哪儿停止和公共运行时从哪儿开始。与它从公共运行时库得到的相比，C#语言自身的创新是什么？

Hejlsberg:

     好的，我想这个混淆来源于这样一个事实—当人们谈论Java时，他们并不真的知道哪个是语言哪个是运行时。当人们谈论Java时，混淆就发生了。哪个语言哪个是运行时？当他们谈论Java时，他们到底指的是什么？Java，语言？Java，语法？还是Java，平台？人们把这些不同的方面混成一团。我们的方式表明我们想成为一个跨语言的平台。我们将创建一个平台，它允许你进行多语言编程，并且共享一套公共的API（应用编程接口）。让我们承认这一点，一些人喜欢用COBOL编程，一些人喜欢用Basic编程，一些人喜欢用C++，还有一些人将会喜欢用C#—我希望。但是，我们不会试图告诉你，忘记你曾经做过的所有的事情吧，我们不会说，“现在只有一种语言，在这个竞争中不会再有创新了”。我们说业界因为弹性而友好。Java是怎么来的？它的出现是因为在它前已经存在一些编程语言，而在它后也还将会出现一些编程语言。我们想打造一个平台，在此你可以偏爱某种语言但不会否定整个价值取向；我们想打造一个平台，它将是创新的。今天谁在帮助COBOL程序员？谁把他们带入WEB？只有在.NET平台上你才可以把富士通COBOL嵌入ASP页面。我的意思是，它真正是革命性的！

Osborn:

     假定.NET平台上支持多语言，那为什么选择C#而不是Visual Basic、C++甚至COBOL？是什么使C#如此引人注目？

Hejlsberg:

     首先，C#可以使我们从一张白纸开始。也就是说，我们没有任何向后兼容性的负担。这显然会使事情简化，无论从是从实现的立场还是从使用的立场都是这样。例如，在C#中，我们只有一类类型，并且总是被垃圾收集。而另一方面，受管制的C++有两套。因为它要保留非垃圾收集风格的编程。因此，在C#中，只需要你理解一些简单的概念。

语言是一个有趣的东西，它是一种口味；语言又是一件严肃的事情，它是程序员选择的一种生活方式。我是指，我们意识到我们不能走出来说，“这儿有个平台，你只可以使用一个基础语言。”即使在那个平台上用一种语言可以做所有的事情，人们还是可能不喜欢它的语法。他们可能喜欢大括号或者一些其它的程序块分界符。那是他们熟悉的。那是使他们感觉舒服并且富有生产力和能力的。我们对待C#的方式仅仅是为认为语言太复杂的C++程序员和认为丢失了一些C和C++语言特性的Java程序员提供一个可选物。我们寻求一个简化C++的方式并投入到一个多语言的平台中，它提供更大的互操作性，并且它提供完备的组件概念等等。

Goodhew:

一件有趣的事情来自于我们对开发者跟踪调查，60%以上的职业开发人员使用两种或更多的语言去创建他们的应用。特别是当我们问他们都用哪些开发工具的时候，我们得到的答案是：没有哪一种开发语言将会是终结者并且所有程序员都会使用它。正如Anders早先所说，人们期望某种能够满足他们所做或他们所感的语法。这是一个个人选择。这也是整个.NET平台所关心的—提供给开发者一个语言实现选择。我想我们做了件漂亮的工作。你基本上可以在Visual Basic.NET和C#中做同样的事情。Visual Basic对大多数程序员来说仍然是易接受的。C#则具有更多的活动空间并且比VB更富威力。

Osborn:

     这意味着在C#中可用更少的声明实现更多？

Hejlsberg:

     是的。意味着通过不安全代码，你可以得到更多的能力。

Osborn:

     也就是说，不能在VB中写不安全代码？

Hejlsberg:

     是的。不可以。

Goodhew:

     但是，基本上，两种语言都可以做同样的事。和Visual Studio 6相比，这是一个根本性的改变。在Visual studio 6.0中，如果你想创建多线程的MTS对象，并且你是一个VB程序员，你就没招。你不得不用C++。现在，有了.NET框架，你可以使用任何一种你喜欢的语言。

Hejlsberg:

     这就是我在一般会议谈话里说过的，.NET框架提供一致的编程模型。在语言和框架的进化过程中，我们一贯似乎都是把一种程序语言绑死在特定的API和特定的编程方式上。VB是快速应用开发工具；MFC（微软基础类）是子类化的方式；ASP则是把东西塞到Web页面中。在每一种情况下，你对编程模型的选择决定了你对程序语言和可使用的API的选择。每次当你变换框架时，它都增加了你学习新语言和API负担的工作量。我们真正努力统一这一切，我们提供一套API，一套支持可视化设计的工具，我们还提供一个可以任选一种适合你的语言的弹性。

Osborn:

     我不知道这对那些使用象VBScript和Jscript脚本语言的有什么作用？

Hejlsberg:

     .NET框架下奇妙的事情之一是使脚本语言能够编译。看看ASP+，现在，实际上，在你的页面里运行的是真正编译的代码。它不是后绑定的、调度查找的—如果用户没有点击页面，你不会看到运行时错误。ASP+开发者可以使用Visual Basic.NET完整的威力而不是VBScript。并且第一次，他们可以使用Perl、Python和其它流行语言，如果他们这么选择的话。

Petrusha:

     服务端的JavaScript现在也能被编译？

Hejlsberg:

     没错。

Goodhew:

.NET框架使得使用脚本语言就象用具有完全特性的语言一样，因为它们现在访问的是一个真正的编程框架并且访问的是同一基类API。你应该看看搞Jscript实现的伙计们都已经实现了什么。[编注：Jscript是微软对ECMA 262语言规范(ECMAScript 版本 3)的实现，只有一些很小的例外（为了保持向后的兼容性），Jscript是对ECMA标准的完整实现]。所以.NET平台提供了一个公共语言框架，对脚本写作者来说，具有极大的好处。

Osborn:

     我们已经讨论关于Java、C++和脚本。在PDC[译注：（微软）职业开发者会议]，我听很多人争论.NET IL（IL是微软中间语言，所有编译器都必须产生它以运行在.NET框架上）和运行于Java虚拟机中的Java字节码并没有什么不同。从你的谈话中，显然你并不同意这一点。你介意进一步评论它们之间的区别吗？

Hejlsberg:

     好的。首先，IL的思想是一个很老的思想了。你可以追溯这个概念到UCSD Pascal p-machine（一个早期的个人计算机Pascal实现）或者Smalltalk。P-code曾被Basic和Visual Basic使用，Word的一个组成部件，内部使用p-code引擎，因为它更精简。所以，p-code并不是什么新东西。

     我认为，我认为我们使用的IL的方式对此感兴趣：我们给你一个选择—如果你愿意—你可以控制把IL编译或翻译为本地代码的时机。实际上，使用受管制的 C++，你可以直接从源程序生成本地代码。受管制的 C++还可以生成IL，就象C#和VB那样。当你安装你的代码时，我们给你一个编译选项，可把IL编译成本地代码。因此，当你运行它们时，就不会有即时编译负担。我们还给你提供了一个动态运行和编译代码的选项—即时编译。有了IL，就给你带来了很多便利，比如它提供了这些能力：移植到不同的CPU结构并引入真正的类型安全并在此之上创建安全的系统。

我认为我们IL的设计和Java字节码关键的不同在于，我们做出了超前的决定—不用解释器。我们的代码永远本地运行。因此，即使产生IL，你也不会运行解释器。我们还有不同风格的JIT。对于精简框架，我们有EconnoJIT，就象我们称呼它的一样，它是一个非常简单的JIT[编注：精简.NET是.NET框架的一个子集，是为移植到其它设备和平台设计的]。对于桌面版，我们有完全功能的JIT。我们甚至有可和我们的C++编译器共用一个后端的JIT。不过，这都会比较耗时，因此你只应该在安装时使用它们。

     一旦你做出偏向于执行本地代码而不是解释码的决定，它就会深深地影响IL设计。它改变了应该包括那些指令，应该包括哪些类型信息，以及它应该如何传输。如果你仔细看看两个IL[译注：即.NET IL和Java字节码]，你就会发现它们非常不同。从某种意义上讲，我们的IL是类型中立的。指令里没有指定参数类型的信息。进一步说，它是靠已经压栈的东西推断出来的。这种方式使IL更为精简。无论如何，一个JIT编译器需要知道哪些信息，因此没有理由在指令里携带它们。所以，最终我们做出了不同的设计决定，而这使得容易把IL翻译成本地代码。

Osborn:

     解释方式和你描述的方式有何不同？

Hejlsberg:

     解释器的核心是一个循环—从p-code流取得一些字节，然后进入一个大大的switch[译注：类似于程序语言里的switch...case]声明：“哦，这是ADD指令，因此它到这儿来，但是这不是…”等等。

     解释器模拟CPU。我们反其道而行之，我们只走一条道，我们一直都走一条道，我们把指令翻译为机器码。现在，在EconoJIT的情况下，机器码实际上非常简单，它只创建一个调用和压栈指令的列表，并且调用运行时帮助器，然后运行时帮助器替换这个列表。当然，这个代码比解释器代码执行得快。

Osborn:

     让我用一句话来总结一下：你们完全编译代码。因此当你编译完时，字节已经完全准备好运行了，尽管从IL翻译成机器码的时机可能不同。

Hejlsberg:

     是的。但是，如果它是在一个内存受限的小设备的环境里，有可能当运行完就被扔掉了。