查看原文
其他

写给 python 程序员的 OpenGL 教程

(给Python开发者加星标,提升Python技能

作者:牧马人 (本文来自作者投稿)

1 预备知识


OpenGL 是 Open Graphics Library 的简写,意为“开放式图形库”,是用于渲染 2D、3D 矢量图形的跨语言、跨平台的应用程序编程接口(API)。OpenGL 不是一个独立的平台,因此,它需要借助于一种编程语言才能被使用。C / C++ / python / java 都可以很好支持 OpengGL,我当然习惯性选择 python 语言。


如果读者是 python 程序员,并且了解 numpy,接下来的阅读应该不会有任何障碍;否则,我建议先花半小时学习一下 python 语言。关于 numpy,可以参考我的另一篇博文《数学建模三剑客MSN》。事实上,我觉得 python 语言近乎于自然语言,只要读者是程序员,即便不熟悉 python,读起来也不会有多大问题。


另外,读者也不必担心数学问题。使用 OpenGL 不需要具备多么高深的数学水平,只要能辅导初中学生的数学作业,就足够用了。


1.1 坐标系


在 OpenGL 的世界里,有各式各样的坐标系。随着对 OpenGL 概念的理解,我们至少会接触到六种坐标系,而初始只需要了解其中的三个就足够用了(第一次阅读这段话的时候,只需要了解世界坐标系就可以了)。


  • 世界坐标系(World Coordinates)

世界坐标系是右手坐标系,以屏幕中心为原点(0, 0, 0),且是始终不变的。 



  • 视点坐标系(Eye or Camera Coordinates)

视点坐标是以视点为原点,以视线的方向为Z+轴正方向的坐标系。OpenGL 管道会将世界坐标先变换到视点坐标,然后进行裁剪,只有在视线范围(视景体)之内的场景才会进入下一阶段的计算。


  • 屏幕坐标系(Window or Screen Coordinates)

OpenGL 的重要功能之一就是将三维的世界坐标经过变换、投影等计算,最终算出它在显示设备上对应的位置,这个位置就称为设备坐标。在屏幕、打印机等设备上的坐标是二维坐标。值得一提的是,OpenGL 可以只使用设备的一部分进行绘制,这个部分称为视区或视口(viewport)。投影得到的是视区内的坐标(投影坐标),从投影坐标到设备坐标的计算过程就是设备变换了。


1.2 投影


三维场景中的物体最终都会显示在类似屏幕这样的二维观察平面上。将三维物体变为二维图形的变换成为投影变换。最常用的投影有两种:平行投影和透视投影。如下图所示,F 是投影面,p1p2 为三维空间中的一条直线,p’1 和 p’2 分别是 p1 和 p2 在 F 上的投影,虚线表示投影线,O 为投影中心。



  • 平行投影

这里所说的平行投影,特指正交平行投影——投影线垂直于投影面。将一个三维点 (x,y,z) 正交平行投影到 xoy 平面上,则投影点坐标为 (x,y,0)。由于平行投影丢弃了深度信息,所以无法产生真实感,但可以保持物体之间相对大小关系不变。


  • 透视投影

透视投影将投影面置于观察点和投影对象之间,距离观察者越远的物体,投影尺寸越小,投影效果具有真实感,常用于游戏和仿真领域。


1.3 视景体


无论是平行投影还是透视投影,投影成像都是在投影面上——我们可以把投影面理解成显示屏幕。世界坐标系描述的三维空间是无限的,投影平面是无限的,但(我们能够看到的)屏幕面积总是有限的,因此在投影变换时,通常只处理能够显示在屏幕上的那一部分三维空间。从无限三维空间中裁切出来的可以显示在屏幕上的部分三维空间,我们称之为视景体。视景体有六个面,分别是左右上下和前后面。


对于平行投影而言,视景体是一个矩形平行六面体;对于透视投影来说,视景体是一个棱台。理解这一点并不难:因为越远处的物体在投影窗口的透视投影越小,也就意味着填满投影窗口需要更大的体量,视景体自然就变成了棱台。



1.4 视口


对于平行投影而言,视口就是由视景体的左右上下四个面围成的矩形,对于透视投影来说,视口就是视景体的前截面在投影窗口上的透视投影。


视口是 OpenGL 中比较重要的概念,现阶段可以简单理解成屏幕(或其他输出设备)。事实上,视口和屏幕是相关但又不相同的,屏幕有固定的宽高比,而视口大小可以由用户自行定义。通常,为了适应不同宽高比的屏幕,在设置视口时,会根据屏幕宽高比调整视景体(增加宽度或高度)。


1.5 视点


现实生活中,人们看到的三维空间物体的样子取决于观察者站在什么角度去看。这里面包含着三个概念:


  • 观察者的位置:眼睛在哪儿?

  • 观察者的姿势:站立还是倒立?左侧卧还是右侧卧?

  • 观察对象:眼睛盯着哪里?


对应在 OpenGL 中,也有同样的概念,即视点的位置、瞄准方向的参考点,以及(向上的)方向。


1.6 OpenGL 变换


下图是三维图形的显示流程。世界坐标系中的三维物体经过视点变换和一系列几何变换(平移、旋转、缩放)之后,坐标系变换为视点坐标系;经过投影和裁剪之后,坐标系变换为归一化设备坐标系;最后经过视口变换显示在屏幕上,相应地,坐标系变成了窗口坐标系。



  • 视点变换:相当于设置视点的位置和方向

  • 模型变换:包括平移、旋转、缩放等三种类型

  • 裁剪变换:根据视景体定义的六个面(和附加裁剪面)对三维空间裁剪

  • 视口变换:将视景体内投影的物体显示在二维的视口平面上


2 安装 pyopengl


如果想当然地使用 pip 如下所示安装,可能会有一些麻烦。


pip install pyopengl


当我这样安装之后,运行 OpenGL 代码,得到了这样的错误信息:


NullFunctionError: Attempt to call an undefined function glutInit, check for bool(glutInit) before calling


原来,pip 默认安装的是32位版本的pyopengl,而我的操作系统是64位的。建议点击这里下载适合自己的版本,直接安装.whl文件。我是这样安装的:


pip install PyOpenGL-3.1.3b2-cp37-cp37m-win_amd64.whl


3 OpenGL 库及函数简介


我第一次接触 OpenGL 的 GL / GLU / GLUT 的时候,一下就被这些长得像孪生兄弟的库名字给整懵圈了,要不是内心强大,也许就跟 OpenGL 说再见了。时间久了才发现,OpenGL 的库及函数命名规则非常合理,便于查找、记忆。


OpenGL函数的命名格式如下:


<库前缀><根命令><可选的参数个数><可选的参数类型>


常见的库前缀有 gl、glu、glut、aux、wgl、glx、agl 等。库前缀表示该函数属于 OpenGL 哪一个开发库。从函数名后面中还可以看出需要多少个参数以及参数的类型。I 代表 int 型,f 代表 float 型,d 代表 double 型,u 代表无符号整型。例如 glColor3f() 表示了该函数属于gl库,参数是三个浮点数。


OpenGL 函数库相关的 API 有核心库(gl)、实用库(glu)、实用工具库(glut)、辅助库(aux)、窗口库(glx、agl、wgl)和扩展函数库等。gl是核心,glu是对gl的部分封装。glut是为跨平台的OpenGL程序的工具包,比aux功能强大。glx、agl、wgl 是针对不同窗口系统的函数。扩展函数库是硬件厂商为实现硬件更新利用OpenGL的扩展机制开发的函数。本文仅对常用的四个库做简单介绍。


3.1 OpenGL 核心库 GL


核心库包含有115个函数,函数名的前缀为gl。这部分函数用于常规的、核心的图形处理。此函数由gl.dll来负责解释执行。由于许多函数可以接收不同数以下几类。据类型的参数,因此派生出来的函数原形多达300多个。核心库中的函数主要可以分为以下几类函数:


  • 绘制基本几何图元的函数:

glBegain()、glEnd()、glNormal*()、glVertex*()


  • 矩阵操作、几何变换和投影变换的函数:

如矩阵入栈函数glPushMatrix(),矩阵出栈函数glPopMatrix(),装载矩阵函数glLoadMatrix(),矩阵相乘函数glMultMatrix(),当前矩阵函数glMatrixMode()和矩阵标准化函数glLoadIdentity(),几何变换函数glTranslate*()、glRotate*()和glScale*(),投影变换函数glOrtho()、glFrustum()和视口变换函数glViewport()


  • 颜色、光照和材质的函数:

如设置颜色模式函数glColor*()、glIndex*(),设置光照效果的函数glLight*() 、glLightModel*()和设置材质效果函数glMaterial()


  • 显示列表函数:

主要有创建、结束、生成、删除和调用显示列表的函数glNewList()、glEndList()、glGenLists()、glCallList()和glDeleteLists()


  • 纹理映射函数:

主要有一维纹理函数glTexImage1D()、二维纹理函数glTexImage2D()、设置纹理参数、纹理环境和纹理坐标的函数glTexParameter*()、glTexEnv*()和glTetCoord*()


  • 特殊效果函数:

融合函数glBlendFunc()、反走样函数glHint()和雾化效果glFog*()


  • 光栅化、象素操作函数:

如象素位置glRasterPos*()、线型宽度glLineWidth()、多边形绘制模式glPolygonMode(),读取象素glReadPixel()、复制象素glCopyPixel()


  • 选择与反馈函数:

主要有渲染模式glRenderMode()、选择缓冲区glSelectBuffer()和反馈缓冲区glFeedbackBuffer()


  • 曲线与曲面的绘制函数:

生成曲线或曲面的函数glMap*()、glMapGrid*(),求值器的函数glEvalCoord*() glEvalMesh*()


  • 状态设置与查询函数:

glGet*()、glEnable()、glGetError()


3.2 OpenGL 实用库 GLU


包含有43个函数,函数名的前缀为glu。OpenGL提供了强大的但是为数不多的绘图命令,所有较复杂的绘图都必须从点、线、面开始。Glu 为了减轻繁重的编程工作,封装了OpenGL函数,Glu函数通过调用核心库的函数,为开发者提供相对简单的用法,实现一些较为复杂的操作。此函数由glu.dll来负责解释执行。OpenGL中的核心库和实用库可以在所有的OpenGL平台上运行。主要包括了以下几种:


  • 辅助纹理贴图函数:

gluScaleImage() 、gluBuild1Dmipmaps()、gluBuild2Dmipmaps()


  • 坐标转换和投影变换函数:

定义投影方式函数gluPerspective()、gluOrtho2D() 、gluLookAt(),拾取投影视景体函数gluPickMatrix(),投影矩阵计算gluProject()和gluUnProject()


  • 多边形镶嵌工具:

gluNewTess()、gluDeleteTess()、gluTessCallback()、gluBeginPolygon()、gluTessVertex()、gluNextContour()、gluEndPolygon()


  • 二次曲面绘制工具:

主要有绘制球面、锥面、柱面、圆环面gluNewQuadric()、gluSphere()、gluCylinder()、gluDisk()、gluPartialDisk()、gluDeleteQuadric()


  • 非均匀有理B样条绘制工具:

主要用来定义和绘制Nurbs曲线和曲面,包括gluNewNurbsRenderer()、gluNurbsCurve()、gluBeginSurface()、gluEndSurface()、gluBeginCurve()、gluNurbsProperty()


  • 错误反馈工具:

获取出错信息的字符串gluErrorString()


3.3 OpenGL 工具库 GLUT


包含大约30多个函数,函数名前缀为glut。glut是不依赖于窗口平台的OpenGL工具包,由Mark KLilgrad在SGI编写(现在在Nvidia),目的是隐藏不同窗口平台API的复杂度。函数以glut开头,它们作为aux库功能更强的替代品,提供更为复杂的绘制功能,此函数由glut.dll来负责解释执行。由于glut中的窗口管理函数是不依赖于运行环境的,因此OpenGL中的工具库可以在X-Window, Windows NT, OS/2等系统下运行,特别适合于开发不需要复杂界面的OpenGL示例程序。对于有经验的程序员来说,一般先用glut理顺3D图形代码,然后再集成为完整的应用程序。这部分函数主要包括:


  • 窗口操作函数:

窗口初始化、窗口大小、窗口位置函数等 glutInit()、glutInitDisplayMode()、glutInitWindowSize()、glutInitWindowPosition()


  • 回调函数:

响应刷新消息、键盘消息、鼠标消息、定时器函数 GlutDisplayFunc()、glutPostRedisplay()、glutReshapeFunc()、glutTimerFunc()、glutKeyboardFunc()、glutMouseFunc()


  • 创建复杂的三维物体:

这些和aux库的函数功能相同


  • 菜单函数:

创建添加菜单的函数 GlutCreateMenu()、glutSetMenu()、glutAddMenuEntry()、glutAddSubMenu() 和 glutAttachMenu()


  • 程序运行函数:

glutMainLoop()


3.4 Windows 专用库 WGL


针对windows平台的扩展,包含有16个函数,函数名前缀为wgl。这部分函数主要用于连接OpenGL和Windows ,以弥补OpenGL在文本方面的不足。 Windows专用库只能用于Windows环境中。这类函数主要包括以下几类:


  • 绘图上下文相关函数:

wglCreateContext()、wglDeleteContext()、wglGetCurrentContent()、wglGetCurrentDC()、wglDeleteContent()


  • 文字和文本处理函数:

wglUseFontBitmaps()、wglUseFontOutlines()


  • 覆盖层、地层和主平面层处理函数:

wglCopyContext()、wglCreateLayerPlane()、wglDescribeLayerPlane()、wglReakizeLayerPlatte()


  • 其他函数:

wglShareLists()、wglGetProcAddress()


4 开始 OpenGL 的奇幻之旅


4.1 OpenGL 基本图形的绘制


4.1.1 设置颜色


设置颜色的函数有几十个,都是以 glColor 开头,后面跟着参数个数和参数类型。参数可以是 0 到 255 之间的无符号整数,也可以是 0 到 1 之间的浮点数。三个参数分别表示 RGB 分量,第四个参数表示透明度(其实叫不透明度更恰当)。以下最常用的两个设置颜色的方法:


glColor3f(1.0,0.0,0.0)  # 设置当前颜色为红色glColor4f(0.0,1.0,1.0,1.0)  # 设置当前颜色为青色,不透明度glColor3ub(0, 0, 255) # 设置当前颜色为蓝色


glColor 也支持将三个或四个参数以向量方式传递,例如:


glColor3fv([0.0,1.0,0.0]) # 设置当前颜色为绿色


特别提示:OpenGL 是使用状态机模式,颜色是一个状态变量,设置颜色就是改变这个状态变量并一直生效,直到再次调用设置颜色的函数。除了颜色,OpenGL 还有很多的状态变量或模式。在任何时间,都可以查询每个状态变量的当前值,还可以用 glPushAttrib() 或 glPushClientAttrib() 把状态变量的集合保存起来,必要的时候,再用 glPopAttrib() 或 glPopClientAttrib() 恢复状态变量。


4.1.2 设置顶点


顶点(vertex)是 OpengGL 中非常重要的概念,描述线段、多边形都离不开顶点。和设置颜色类似,设置顶点的函数也有几十个,都是以 glVertex 开头,后面跟着参数个数和参数类型,同样也支持将多个以向量方式传递。 两个参数的话,分别表示 xy 坐标,三个参数则分别表示 xyz 坐标。如有第四个参数,则表示该点的齐次坐标 w;否则,默认 w=1。至于什么是齐次坐标,显然超出了初中数学的范畴,在此不做探讨。


glVertex2f(1.0,0.5) # xoy平面上的点,z=0glVertex3f(0.5,1.0,0.0) # 三维空间中的点


4.1.3 绘制基本图形


仅仅设置颜色和顶点,并不能画出来什么。我们可以在任何时候改变颜色,但所有的顶点设置,都必须包含在 glBegin() 和 glEnd() 之间,而 glBegin() 的参数则指定了将这些顶点画成什么。以下是 glBegin() 可能的参数选项:


参数                             说明

GL_POINTS            绘制一个或多个顶点

GL_LINES                    绘制线段

GL_LINE_STRIP    绘制连续线段

GL_LINE_LOOP    绘制闭合的线段

GL_POLYGON            绘制多边形

GL_TRIANGLES    绘制一个或多个三角形

GL_TRIANGLE_STRIP  绘制连续三角形

GL_TRIANGLE_FAN    绘制多个三角形组成的扇形

GL_QUADS            绘制一个或多个四边形

GL_QUAD_STRIP    绘制连续四边形


4.2 第一个 OpenGL 程序


通常,我们使用工具库(GLUT)创建 OpenGL 应用程序。为啥不用 GL 或者 GLU 库呢?画画之前总得先有一块画布吧,不能直接拿起画笔就开画。前文说过,工具库主要提供窗口相关的函数,有了窗口,就相当于有了画布,而核心库和实用库,就好比各式各样的画笔、颜料。使用工具库(GLUT)创建 OpenGL 应用程序只需要四步(当然,前提是你需要先准备好绘图函数,并给它取一个合适的名字):


  1. 初始化glut库

  2. 创建glut窗口

  3. 注册绘图的回调函数

  4. 进入glut主循环


OK,铺垫了这么多之后,我们终于开始第一个 OpenGL 应用程序了:绘制三维空间的世界坐标系,在坐标原点的后方(z轴的负半区)画一个三角形。代码如下:


# -*- coding: utf-8 -*-# -------------------------------------------# quidam_01.py 三维空间的世界坐标系和三角形# -------------------------------------------from OpenGL.GL import *from OpenGL.GLUT import *def draw():
# ---------------------------------------------------------------
    glBegin(GL_LINES)                    # 开始绘制线段(世界坐标系)    # 以红色绘制x轴    glColor4f(1.0, 0.0, 0.0, 1.0)        # 设置当前颜色为红色不透明    glVertex3f(-0.8, 0.0, 0.0)           # 设置x轴顶点(x轴负方向)    glVertex3f(0.8, 0.0, 0.0)            # 设置x轴顶点(x轴正方向)        #以绿色绘制y轴
    glColor4f(0.0, 1.0, 0.0, 1.0)        # 设置当前颜色为绿色不透明    glVertex3f(0.0, -0.8, 0.0)           # 设置y轴顶点(y轴负方向) glVertex3f(0.0, 0.8, 0.0) # 设置y轴顶点(y轴正方向)    # 以蓝色绘制z轴    glColor4f(0.0, 0.0, 1.0, 1.0)        # 设置当前颜色为蓝色不透明    glVertex3f(0.0, 0.0, -0.8)           # 设置z轴顶点(z轴负方向) glVertex3f(0.0, 0.0, 0.8) # 设置z轴顶点(z轴正方向) glEnd() # 结束绘制线段
    # ---------------------------------------------------------------    glBegin(GL_TRIANGLES)                # 开始绘制三角形(z轴负半区)    glColor4f(1.0, 0.0, 0.0, 1.0)        # 设置当前颜色为红色不透明    glVertex3f(-0.5, -0.366, -0.5)       # 设置三角形顶点    glColor4f(0.0, 1.0, 0.0, 1.0)        # 设置当前颜色为绿色不透明    glVertex3f(0.5, -0.366, -0.5)        # 设置三角形顶点    glColor4f(0.0, 0.0, 1.0, 1.0)        # 设置当前颜色为蓝色不透明 glVertex3f(0.0, 0.5, -0.5) # 设置三角形顶点
    glEnd()                              # 结束绘制三角形        # --------------------------------------------------------------- glFlush() # 清空缓冲区,将指令送往硬件立即执行if __name__ == "__main__":    glutInit()                           # 1. 初始化glut库    glutCreateWindow('Quidam Of OpenGL') # 2. 创建glut窗口    glutDisplayFunc(draw)                # 3. 注册回调函数draw() glutMainLoop() # 4. 进入glut主循环


运行代码,我这里显示结果如下面左图所示。如果尝试运行这段代码出错的话,我猜应该是 pyopengl 安装出现了问题,建议返回到前面重读 pyopengl 的安装。

短暂的激动之后,你可能会尝试画一些其他的线段,变换颜色或者透明度,甚至绘制多边形。很快你会发现,我们的第一个程序有很多问题,比如:


  1. 窗口的标题不能使用中文,否则会显示乱码

  2. 窗口的初始大小和位置无法改变

  3. 改变窗口的宽高比,三角形宽高比也会改变(如上面右图所示)

  4. 三角形不应该遮挡坐标轴

  5. 改变颜色的透明度无效

  6. 不能缩放旋转


没关系,除了第1个问题我不知道怎么解决(貌似无解),其他问题都不是事儿。和我们的代码相比,一个真正实用的 OpenGL 程序,还有许多工作要做:


  • 设置初始显示模式

  • 初始化画布

  • 绘图函数里面需要增加:


  1. 清除屏幕及深度缓存

  2. 投影设置

  3. 模型试图设置

  4. 绑定鼠标键盘的事件函数


4.3 设置初始显示模式


初始化 glut 库的时候,我们一般都要用 glutInitDisplayMode() 来设置初始的显示模式,它的参数可以是下表中参数的组合。


参数                 说明

GLUT_RGB 指定RGB颜色模式的窗口

GLUT_RGBA 指定RGBA 颜色模式的窗口

GLUT_INDEX 指定颜色索引模式的窗口

GLUT_SINGLE 指定单缓存窗口

GLUT_DOUBLE 指定双缓存窗口

GLUT_ACCUM 窗口使用累加缓存

GLUT_ALPHA 窗口的颜色分量包含 alpha 值

GLUT_DEPTH 窗口使用深度缓存

GLUT_STENCIL 窗口使用模板缓存

GLUT_MULTISAMPLE 指定支持多样本功能的窗口

GLUT_STEREO 指定立体窗口

GLUT_LUMINANCE 窗口使用亮度颜色模型

使用双缓存窗口,可以避免重绘时产生抖动的感觉。我一般选择 GLUT_DOUBLE | GLUT_ALPHA | GLUT_DEPTH 作为参数来设置初始的显示模式。


4.4 初始化画布


开始绘图之前,需要对画布做一些初始化工作,这些工作只需要做一次。比如:


glClearColor(0.0, 0.0, 0.0, 1.0) # 设置画布背景色。注意:这里必须是4个参数glEnable(GL_DEPTH_TEST)          # 开启深度测试,实现遮挡关系glDepthFunc(GL_LEQUAL) # 设置深度测试函数(GL_LEQUAL只是选项之一)


如有必要,还可以开启失真校正(反走样)、开启表面剔除等。


4.5 清除屏幕及深度缓存


每次重绘之前,需要先清除屏幕及深度缓存。这项操作一般放在绘图函数的开头。


glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT)


4.5 设置投影


投影设置也是每次重绘都需要的步骤之一。glOrtho() 用来设置平行投影,glFrustum() 用来设置透视投影。这两个函数的参数相同,都是视景体的 left / right / bottom / top / near / far 六个面。


视景体的 left / right / bottom / top 四个面围成的矩形,就是视口。near 就是投影面,其值是投影面距离视点的距离,far 是视景体的后截面,其值是后截面距离视点的距离。far 和 near 的差值,就是视景体的深度。视点和视景体的相对位置关系是固定的,视点移动时,视景体也随之移动。


我个人认为,视景体是 OpengGL 最重要、最核心的概念,它和视口、视点、投影面、缩放、漫游等概念密切关联。只有正确理解了视景体,才能正确设置它的六个参数,才能呈现出我们期望的效果。


为了在窗口宽高比改变时,绘制的对象仍然保持固定的宽高比,一般在做投影变换时,需要根据窗口的宽高比适当调整视景体的 left / right 或者 bottom / top 参数。


假设 view 是视景体,width 和 height 是窗口的宽度和高度,在投影变换之前,需要先声明是对投影矩阵的操作,并将投影矩阵单位化:


glMatrixMode(GL_PROJECTION)glLoadIdentity()if width > height:  k = width / height  glFrustum(view [0]*k, view [1]*k, view [2], view [3], view [4], view [5])else:  k = height / width glFrustum(view [0], view [1], view [2]*k, view [3]*k, view [4], view [5])


4.6 设置视点


视点是和视景体关联的概念。设置视点需要考虑眼睛在哪儿、看哪儿、头顶朝哪儿,分别对应着eye, lookat 和 eye_up 三个向量。


gluLookAt(       eye[0], eye[1], eye[2],        look_at[0], look_at[1], look_at[2],       eye_up[0], eye_up[1], eye_up[2] )


4.7 设置视口


视口也是和视景体关联的概念,相对简单一点。


glViewport(0, 0, width, height)


4.8 设置模型视图


模型平移、旋转、缩放等几何变换,需要切换到模型矩阵:


glMatrixMode(GL_MODELVIEW)glLoadIdentity()glScale(1.0, 1.0, 1.0)


4.9 捕捉鼠标事件、键盘事件和窗口事件


GLUT 库提供了几个函数帮我们捕捉鼠标事件、键盘事件和窗口事件:


glutMouseFunc()

该函数捕捉鼠标点击和滚轮操作,返回4个参数给被绑定的事件函数:键(左键/右键/中键/滚轮上/滚轮下)、状态(1/0)、x坐标、y坐标


1.glutMotionFunc()

该函数捕捉有一个鼠标键被按下时的鼠标移动给被绑定的事件函数,返回2个参数:x坐标、y坐标


2.glutPassiveMotionFunc()

该函数捕捉鼠标移动,返回2个参数给被绑定的事件函数:x坐标、y坐标


3.glutEntryFunc()

该函数捕捉鼠标离开或进入窗口区域,返回1个参数给被绑定的事件函数:GLUT_LEFT 或者 GLUT_ENTERED


4.glutKeyboardFunc(keydown)

该函数捕捉键盘按键被按下,返回3个参数给被绑定的事件函数:被按下的键,x坐标、y坐标


5.glutReshapeFunc()

该函数捕捉窗口被改变大小,返回2个参数给被绑定的事件函数:窗口宽度、窗口高度


如果我们需要捕捉这些事件,只需要定义事件函数,注册相应的函数就行:


def reshape(width, height): pass
def mouseclick(button, state, x, y):  passdef mousemotion(x, y): pass
def keydown(key, x, y):  passglutReshapeFunc(reshape)            # 注册响应窗口改变的函数reshape()glutMouseFunc(mouseclick)           # 注册响应鼠标点击的函数mouseclick()glutMotionFunc(mousemotion)         # 注册响应鼠标拖拽的函数mousemotion()glutKeyboardFunc(keydown) # 注册键盘输入的函数keydown()


4.10 综合应用


是时候把我们上面讲的这些东西完整的演示一下了。下面的代码还是画了世界坐标系,并在原点前后各画了一个三角形。鼠标可以拖拽视点绕参考点旋转(二者距离保持不变),滚轮可以缩放模型。敲击退格键或回车键可以让视点远离或接近参考点。敲击 x/y/z 可以减小参考点对应的坐标值,敲击 X/Y/Z 可以增大参考点对应的坐标值。敲击空格键可以切换投影模式。



上图左是平行投影模式的显示效果,上图右是透视投影模式的显示效果。代码如下:


# -*- coding: utf-8 -*-# -------------------------------------------# quidam_02.py 旋转、缩放、改变视点和参考点# -------------------------------------------from OpenGL.GL import *from OpenGL.GLU import *from OpenGL.GLUT import *import numpy as np
IS_PERSPECTIVE = True                               # 透视投影VIEW = np.array([-0.8, 0.8, -0.8, 0.8, 1.0, 20.0])  # 视景体的left/right/bottom/top/near/far六个面SCALE_K = np.array([1.0, 1.0, 1.0]) # 模型缩放比例
EYE = np.array([0.0, 0.0, 2.0]) # 眼睛的位置(默认z轴的正方向)
LOOK_AT = np.array([0.0, 0.0, 0.0]) # 瞄准方向的参考点(默认在坐标原点)
EYE_UP = np.array([0.0, 1.0, 0.0])                  # 定义对观察者而言的上方(默认y轴的正方向)WIN_W, WIN_H = 640, 480                             # 保存窗口宽度和高度的变量LEFT_IS_DOWNED = False                              # 鼠标左键被按下MOUSE_X, MOUSE_Y = 0, 0                             # 考察鼠标位移量时保存的起始位置

def getposture():    global EYE, LOOK_A        dist = np.sqrt(np.power((EYE-LOOK_AT), 2).sum())    if dist > 0:        phi = np.arcsin((EYE[1]-LOOK_AT[1])/dist)        theta = np.arcsin((EYE[0]-LOOK_AT[0])/(dist*np.cos(phi)))    else: phi = 0.0        theta = 0.0         return dist, phi, theta    DIST, PHI, THETA = getposture()                     # 眼睛与观察目标之间的距离、仰角、方位角

def init():
glClearColor(0.0, 0.0, 0.0, 1.0) # 设置画布背景色。注意:这里必须是4个参数
glEnable(GL_DEPTH_TEST) # 开启深度测试,实现遮挡关系
glDepthFunc(GL_LEQUAL) # 设置深度测试函数(GL_LEQUAL只是选项之一)


def draw():
global IS_PERSPECTIVE, VIEW
global EYE, LOOK_AT, EYE_UP
global SCALE_K
global WIN_W, WIN_H

# 清除屏幕及深度缓存
glClear(GL_COLOR_BUFFER_BIT | GL_DEPTH_BUFFER_BIT)

# 设置投影(透视投影)
glMatrixMode(GL_PROJECTION)
glLoadIdentity()

if WIN_W > WIN_H:
if IS_PERSPECTIVE:
glFrustum(VIEW[0]*WIN_W/WIN_H, VIEW[1]*WIN_W/WIN_H, VIEW[2], VIEW[3], VIEW[4], VIEW[5])
else:
glOrtho(VIEW[0]*WIN_W/WIN_H, VIEW[1]*WIN_W/WIN_H, VIEW[2], VIEW[3], VIEW[4], VIEW[5])
else:
if IS_PERSPECTIVE:
glFrustum(VIEW[0], VIEW[1], VIEW[2]*WIN_H/WIN_W, VIEW[3]*WIN_H/WIN_W, VIEW[4], VIEW[5])
else:
glOrtho(VIEW[0], VIEW[1], VIEW[2]*WIN_H/WIN_W, VIEW[3]*WIN_H/WIN_W, VIEW[4], VIEW[5])

# 设置模型视图
glMatrixMode(GL_MODELVIEW)
glLoadIdentity()

# 几何变换
glScale(SCALE_K[0], SCALE_K[1], SCALE_K[2])

# 设置视点
gluLookAt(
EYE[0], EYE[1], EYE[2],
LOOK_AT[0], LOOK_AT[1], LOOK_AT[2],
EYE_UP[0], EYE_UP[1], EYE_UP[2]
)

# 设置视口
glViewport(0, 0, WIN_W, WIN_H)    
    # --------------------------------------------------------------- glBegin(GL_LINES) # 开始绘制线段(世界坐标系)

# 以红色绘制x轴
glColor4f(1.0, 0.0, 0.0, 1.0) # 设置当前颜色为红色不透明
glVertex3f(-0.8, 0.0, 0.0) # 设置x轴顶点(x轴负方向)
glVertex3f(0.8, 0.0, 0.0) # 设置x轴顶点(x轴正方向)

# 以绿色绘制y轴
glColor4f(0.0, 1.0, 0.0, 1.0) # 设置当前颜色为绿色不透明
glVertex3f(0.0, -0.8, 0.0) # 设置y轴顶点(y轴负方向)
glVertex3f(0.0, 0.8, 0.0) # 设置y轴顶点(y轴正方向)

# 以蓝色绘制z轴
glColor4f(0.0, 0.0, 1.0, 1.0) # 设置当前颜色为蓝色不透明
glVertex3f(0.0, 0.0, -0.8) # 设置z轴顶点(z轴负方向)
glVertex3f(0.0, 0.0, 0.8) # 设置z轴顶点(z轴正方向)

glEnd() # 结束绘制线段

# ---------------------------------------------------------------
glBegin(GL_TRIANGLES) # 开始绘制三角形(z轴负半区)

glColor4f(1.0, 0.0, 0.0, 1.0) # 设置当前颜色为红色不透明
glVertex3f(-0.5, -0.366, -0.5) # 设置三角形顶点
glColor4f(0.0, 1.0, 0.0, 1.0) # 设置当前颜色为绿色不透明
glVertex3f(0.5, -0.366, -0.5) # 设置三角形顶点
glColor4f(0.0, 0.0, 1.0, 1.0) # 设置当前颜色为蓝色不透明
    glVertex3f(0.0, 0.5, -0.5)           # 设置三角形顶点    glEnd()                              # 结束绘制三角形    # ---------------------------------------------------------------
glBegin(GL_TRIANGLES) # 开始绘制三角形(z轴正半区)    glColor4f(1.0, 0.0, 0.0, 1.0)        # 设置当前颜色为红色不透明 glVertex3f(-0.5, 0.5, 0.5) # 设置三角形顶点
glColor4f(0.0, 1.0, 0.0, 1.0) # 设置当前颜色为绿色不透明
glVertex3f(0.5, 0.5, 0.5) # 设置三角形顶点
glColor4f(0.0, 0.0, 1.0, 1.0) # 设置当前颜色为蓝色不透明
glVertex3f(0.0, -0.366, 0.5) # 设置三角形顶点

glEnd() # 结束绘制三角形 # ---------------------------------------------------------------
glutSwapBuffers() # 切换缓冲区,以显示绘制内容def reshape(width, height):
global WIN_W, WIN_H

WIN_W, WIN_H = width, height
glutPostRedisplay()

def mouseclick(button, state, x, y):
global SCALE_K
global LEFT_IS_DOWNED
global MOUSE_X, MOUSE_Y
     MOUSE_X, MOUSE_Y = x, y
    if button == GLUT_LEFT_BUTTON:            LEFT_IS_DOWNED = state==GLUT_DOWN
    elif button == 3:        SCALE_K *= 1.05        glutPostRedisplay()    elif button == 4: SCALE_K *= 0.95        glutPostRedisplay()    def mousemotion(x, y):    global LEFT_IS_DOWNED    global EYE, EYE_UP    global MOUSE_X, MOUSE_Y    global DIST, PHI, THETA    global WIN_W, WIN_H     if LEFT_IS_DOWNED:        dx = MOUSE_X - x        dy = y - MOUSE_Y        MOUSE_X, MOUSE_Y = x, y                PHI += 2*np.pi*dy/WIN_H        PHI %= 2*np.pi        THETA += 2*np.pi*dx/WIN_W       THETA %= 2*np.pi r = DIST*np.cos(PHI)                EYE[1] = DIST*np.sin(PHI)        EYE[0] = r*np.sin(THETA)        EYE[2] = r*np.cos(THETA)                   if 0.5*np.pi < PHI < 1.5*np.pi:            EYE_UP[1] = -1.0 else:            EYE_UP[1] = 1.0            glutPostRedisplay()   def keydown(key, x, y):    global DIST, PHI, THETA global EYE, LOOK_AT, EYE_UP    global IS_PERSPECTIVE, VIEW
    if key in [b'x', b'X', b'y', b'Y', b'z', b'Z']:        if key == b'x': # 瞄准参考点 x 减小            LOOK_AT[0] -= 0.01       elif key == b'X': # 瞄准参考 x 增大            LOOK_AT[0] += 0.01        elif key == b'y': # 瞄准参考点 y 减小            LOOK_AT[1] -= 0.01        elif key == b'Y': # 瞄准参考点 y 增大 LOOK_AT[1] += 0.01
elif key == b'z': # 瞄准参考点 z 减小
            LOOK_AT[2] -= 0.01 elif key == b'Z': # 瞄准参考点 z 增大
            LOOK_AT[2] += 0.01       
        DIST, PHI, THETA = getposture()        glutPostRedisplay() elif key == b'\r': # 回车键,视点前进
EYE = LOOK_AT + (EYE - LOOK_AT) * 0.9
DIST, PHI, THETA = getposture()
glutPostRedisplay()
elif key == b'\x08': # 退格键,视点后退
EYE = LOOK_AT + (EYE - LOOK_AT) * 1.1
DIST, PHI, THETA = getposture()
glutPostRedisplay()
elif key == b' ': # 空格键,切换投影模式
IS_PERSPECTIVE = not IS_PERSPECTIVE
        glutPostRedisplay()
if __name__ == "__main__":
    glutInit()    displayMode = GLUT_DOUBLE | GLUT_ALPHA | GLUT_DEPTH    glutInitDisplayMode(displayMode)
    glutInitWindowSize(WIN_W, WIN_H)    glutInitWindowPosition(300, 200) glutCreateWindow('Quidam Of OpenGL')   
init() # 初始化画布
glutDisplayFunc(draw) # 注册回调函数draw()
glutReshapeFunc(reshape) # 注册响应窗口改变的函数reshape()
    glutMouseFunc(mouseclick)           # 注册响应鼠标点击的函数mouseclick()    glutMotionFunc(mousemotion)         # 注册响应鼠标拖拽的函数mousemotion()    glutKeyboardFunc(keydown)           # 注册键盘输入的函数keydown() glutMainLoop() # 进入glut主循环


4.11 小结


虽然还有很多领域需要我们继续探索,比如灯光、材质、雾化、拾取等,但那不是奇幻之旅的目标。奇幻之旅仅仅是帮助读者建立 OpenGL 的基本概念。至此,我们基本完成了任务。


5 加速渲染


实际应用 OpenGL 绘制三维图像时,往往需要处理数以万计的顶点,有时甚至是百万级、千万级。我们通常不会在绘制函数里面传送这些数据,而是在绘制之前,将这些数据提前传送到GPU。绘制函数每次绘制时,只需要从GPU的缓存中取出数据即可,极大地提高了效率。这个机制地实现,依赖于顶点缓冲区对象(Vertex Buffer Object),简称VBO。


尽管 VBO 是显卡的扩展,其实没有用到GPU运算,也就是说 VBO 不用写着色语言,直接用opengl函数就可以调用,主要目的是用于加快渲染的速。


VBO 将顶点信息放到 GPU 中,GPU 在渲染时去缓存中取数据,二者中间的桥梁是 GL-Context。GL-Context 整个程序一般只有一个,所以如果一个渲染流程里有两份不同的绘制代码,GL-context 就负责在他们之间进行切换。这也是为什么要在渲染过程中,在每份绘制代码之中会有 glBindbuffer、glEnableVertexAttribArray、glVertexAttribPointer。如果把这些都放到初始化时候完成,使用一种结构记录该次绘制所需要的所有 VBO 所需信息,把它保存到 VBO特定位置,绘制的时候直接在这个位置取信息绘制,会简化渲染流程、提升渲染速度。这就是 VAO 概念产生的初衷。


VAO 的全名是 Vertex Array Object,首先,它不是 Buffer-Object,所以不用作存储数据;其次,它针对“顶点”而言,也就是说它跟“顶点的绘制”息息相关。VAO 记录的是一次绘制中所需要的信息,这包括“数据在哪里 glBindBuffer”、“数据的格式是怎么样的 glVertexAttribPointer”、shader-attribute 的 location 的启用 glEnableVertexAttribArray。


根据我查到的资料,几乎所有的显卡都支持 VBO,但不是所有的显卡都支持 VAO,而 VAO 仅仅是优化了 VBO 的使用方法,对于加速并没有实质性的影响,因此本文只讨论 VBO 技术。


5.1 创建顶点缓冲区对象(VBO)


假定画一个六面体,顶点是这样的:


# 六面体数据
# ------------------------------------------------------
# v4----- v5
# /| /|
# v0------v1|
# | | | |
# | v7----|-v6
# |/ |/
# v3------v2


# 顶点集
vertices = np.array([
-0.5, 0.5, 0.5, 0.5, 0.5, 0.5, 0.5, -0.5, 0.5, -0.5, -0.5, 0.5, # v0-v1-v2-v3
-0.5, 0.5, -0.5, 0.5, 0.5, -0.5, 0.5, -0.5, -0.5, -0.5, -0.5, -0.5 # v4-v5-v6-v7
], dtype=np.float32)


# 索引集
indices = np.array([
0, 1, 2, 3, # v0-v1-v2-v3 (front)
4, 5, 1, 0, # v4-v5-v1-v0 (top)
3, 2, 6, 7, # v3-v2-v6-v7 (bottom)
5, 4, 7, 6, # v5-v4-v7-v6 (back)
1, 5, 6, 2, # v1-v5-v6-v2 (right)
4, 0, 3, 7 # v4-v0-v3-v7 (left)
], dtype=np.int)


在GPU上创建VBO如下:


from OpenGL.arrays import vbo
vbo_vertices = vbo.VBO(vertices)vbo_indices = vbo.VBO(indices, target=GL_ELEMENT_ARRAY_BUFFER)


创建 顶点 VBO 时,默认 target=GL_ARRAY_BUFFER, 而创建索引 VBO 时,target=GL_ELEMENT_ARRAY_BUFFER,因为顶点的数据类型是 np.float32,索引的数据类型是np.int。


在VBO保存的顶点数据集,除了顶点信息外,还可以包含颜色、法线、纹理等数据,这就是顶点混合数组的概念。假定我们在上面的顶点集中增加每个顶点的颜色,则可以写成这样:


vertices = np.array([    0.3, 0.6, 0.9, -0.35, 0.35, 0.35,   # c0-v0    0.6, 0.9, 0.3, 0.35, 0.35, 0.35,    # c1-v1    0.9, 0.3, 0.6, 0.35, -0.35, 0.35,   # c2-v2     0.3, 0.9, 0.6, -0.35, -0.35, 0.35,  # c3-v3     0.6, 0.3, 0.9, -0.35, 0.35, -0.35,  # c4-v4     0.9, 0.6, 0.3, 0.35, 0.35, -0.35,   # c5-v5   0.3, 0.9, 0.9, 0.35, -0.35, -0.35,  # c6-v6   0.9, 0.9, 0.3, -0.35, -0.35, -0.35  # c7-v7], dtype=np.float32)


5.2 分离顶点混合数组


使用 glInterleavedArrays() 函数可以从顶点混合数组中分离顶点、颜色、法线和纹理。比如,对只包含顶点信息的顶点混合数组:


vbo_indices.bind()
glInterleavedArrays(GL_V3F, 0, None)


如果顶点混合数组包含了颜色和顶点信息:


vbo_indices.bind()glInterleavedArrays(GL_C3F_V3F, 0, None)


glInterleavedArrays() 函数第一个参数总共有14个选项,分别是:


  • GL_V2F

  • GL_V3F

  • GL_C4UB_V2F

  • GL_C4UB_V3F

  • GL_C3F_V3F

  • GL_N3F_V3F

  • GL_C4F_N3F_V3F

  • GL_T2F_V3F

  • GL_T4F_V4F

  • GL_T2F_C4UB_V3F

  • GL_T2F_C3F_V3F

  • GL_T2F_N3F_V3F

  • GL_T2F_C4F_N3F_V3F

  • GL_T4F_C4F_N3F_V4F


5.3 使用顶点缓冲区对象(VBO)


使用glDrawElements() 等函数绘制前,需要先绑定顶点数据集和索引数据集,然后使用glInterleavedArrays() 分理出顶点、颜色、法线等数据。

vbo_indices.bind()glInterleavedArrays(GL_V3F, 0, None)vbo_indices.bind()glDrawElements(GL_QUADS, int(vbo_indices .size/4), GL_UNSIGNED_INT, None)vbo_indices.unbind()vbo_indices.unbind()


6 致谢


写作过程中,我参考了很多资料,包括纸质书籍和网页,列写于此,一并致谢!

  • 《OpenGL编程精粹》杨柏林 陈根浪 徐静 编著

  • Opengl开发库介绍

  • OpenGL的API函数使用手册

  • glut处理鼠标事件

  • Learn OpenGL



【本文作者】


许向武:山东远思信息科技有限公司CEO,网名牧码人(天元浪子),齐国土著,太公之后。少小离家,独闯江湖,后归隐于华不注山。素以敲击键盘为业,偶尔游戏于各网络对局室,擅长送财送分,深为众棋友所喜闻乐见。


推荐阅读

(点击标题可跳转阅读)

写给工程师的 10 条精进原则

写给程序员的有效学习方法



觉得本文对你有帮助?请分享给更多人

关注「Python开发者」加星标,提升Python技能

好文章,我在看❤️

    您可能也对以下帖子感兴趣

    文章有问题?点此查看未经处理的缓存