人機交互基礎
人機交互概述
人機交互及其發(fā)展
- 人機交互是指人與計算機之間,使用某種對話語言,以一定的交互方式,為完成確定任務的信息交換過程。
從計算機的誕生之日起,人機交互技術的發(fā)展已經歷了以下階段:- 早期的手工作業(yè);(計算機專業(yè)人員直接用機器語言與硬件通訊)
- 作業(yè)控制語言及交互命令語言;(如DOS-Disk Operation System)
- 圖形用戶界面;(GUI-Graphical User Interface,如Windows)
- 網絡用戶界面;(常用的網絡操作系統界面,如Unix、Linux、Windows NT等等)
- 智能人機交互等發(fā)展階段(尚在發(fā)展之中)
人機交互方式
(1)問答式交互
(2)菜單選擇
(3)填表技術
(4)命令語言
(5)直接操縱
(6)語音交互
(7)圖像交互
(8)行為交互
人機界面
- 人機界面(HumanMachine Interaction,HMI),又稱用戶界面或使用者界面,是人與計算機之間傳遞、交換信息的媒介和對話接口。
- 人機界面設計是指通過一定的手段對用戶界面有目標和計劃的一種創(chuàng)作活動。
主要包括3個方面: - 設計軟件構件之間的接口;
- 設計模塊和其他非人的信息生產者和消費者的界面;
- 設計計算機用戶和計算機間的界面。
- 目前,WIMP用戶界面是主要的人機交互界面,W指窗口(Windows)、I指圖標(Icons)、M指菜單(Menus)、P指指點設備(PointingDevice)。
新型人機交互技術
顯示屏技術
- 計算機(向用戶完成)信息輸出、展示的主要外部設備是顯示器,傳統的顯示器是CRT(Cathode Ray Tube)陰極射線管的顯示器,現代已被液晶顯示器,或稱LCD(Liquid Crystal Display)替代,它的主要原理是以電流刺激液晶分子產生點、線、面配合背部燈管構成畫面。
- 觸摸式顯示屏;(微型機、手機、平板電腦常用)
- 柔性顯示屏;(見諸于高端手機)
- 3D顯示器;(造價高,虛擬現實系統的輸出設備)
- 視網膜顯示器(研究、發(fā)展之中)
跟蹤與識別(技術)
- 是指能使得計算機系統跟蹤、識別用戶(人類)的語言、行為、動作的裝置及技術,或者用戶捕捉信息的設備與技術
(1)地理空間跟蹤;(坐標、位置)
(2)動作識別;(動作,肢體語言)
(3)觸覺交互;(用戶與物體接觸后的動作反應)
(4)語音識別;(語言)
(5)無聲語音 (默讀)識別;(如唇語,無聲的輕微的動作)
(6)眼動跟蹤;(依據眼部動作的細微變化捕捉信息)
(7)電觸覺刺激 (無視覺能力的用戶通過脈沖信號感知信息)
(8)仿生隱形眼鏡(增強用戶的視覺感知能力)
腦-機接口
- 腦-機接口是在人腦與計算機或其它電子設備之間建立的直接的交流和控制通道,通過這種通道,人就可以直接通過腦來表達想法或操縱設備,而不需要語言或動作,這可以有效增強身體嚴重殘疾的患者與外界交流或控制外部環(huán)境的能力,以提高患者的生活質量。
- 腦-機接口分為非侵入式(通過貼近大腦的外部電極等傳感部件實現腦-機相連)和侵入式(電極等傳感部件植入人腦)兩種。
- 大部分腦-機都采用的是“輸入”方式(從大腦向機器輸入),即由人利用思想來操控外部機械或設備;而由人腦來接收外部指令(從機器向大腦輸入)并形成感受、語言甚至思想還面臨著技術上的挑戰(zhàn)。
多媒體技術
多媒體技術基礎
多媒體的概念
- 媒體(media) 是指傳送信息的載體和表現形式。
在通常情況下 ,媒體可分為5種形式,分別為
- 感覺媒體:語言、文字、符號、聲音、圖形、圖像、動畫、視頻
- 表示媒體:信息的表示形式,數字化編碼
- 顯示媒體:輸入、輸出設備,如鼠標、攝像機,顯示器、音箱等
- 存儲媒體:存儲的物理介質,如硬盤、光盤、磁帶等
- 傳輸媒體:媒體通信的載體,即通信信道
多媒體(multi-media)是指融合兩種或兩種以上媒體的一種人機交互式信息交流和傳播媒體。
媒體間的關聯
多媒體技術及其特性
- 多媒體技術是用戶通過多種感官與計算機進行實時信息交互的技術,其通過計算機對文字、圖形、圖像、聲音、動畫、視頻等多種媒體信息進行綜合處理和管理。
- 多媒體技術的特性包括集成性、多樣性、交互性、可傳播性和可存儲性等。
多媒體技術的應用
- 多媒體系統的應用更以極強的滲透力進入人類生活的各個領域,如商業(yè)、教育、通信、醫(yī)療、出版、藝術、娛樂、金融、建筑、家庭等等。
多媒體技術發(fā)展趨勢
(1)多媒體技術的集成化
(2)多媒體技術的網絡化
(3)多媒體終端的智能化和嵌入化
多媒體應用技術
文字(語言的符號化)處理技術
- 文本的開發(fā)與設計包括普通文字、圖形文字、動態(tài)文字等開發(fā)。
音頻(語言的信號化)處理技術
- 計算機要處理音頻信號,首先要將(連續(xù)的模擬)音頻信號轉換為(離散的)數字信號。
聲音的數字化
聲音的數字化包括 采樣、量化和編碼 3個步驟
模擬音頻數字化的流程
① 采樣:
- 對連續(xù)信號按一定的時間間隔采取樣本點。奈奎斯特采樣定理認為,只要采樣頻率大于等于信號中所包含的最高頻率的兩倍,則可以根據其采樣完全恢復出原始信號,這相當于當信號是最高頻率時,每一周期至少要采取兩個點。 但這只是理論上的定理,在實際操作中,人們用混疊波形,從而使取得的信號更接近原始信號。
② 量化:
- 采樣的離散音頻要轉化為計算機能夠表示的數據范圍,這個過程稱為量化。 量化的等級取決于量化精度,也就是用多少位二進制數來表示一個音頻數據。一般有8位,12位或16位。量化精度越高,聲音的保真度越高。
③ 編碼:
-
將量化的音頻采樣數據轉化為二進制數據,但實際上就是對音頻信號進行編碼,但用不同的采樣頻率和不同的量化位數記錄聲音,在單位時間中,所需存貯空間是不一樣的。
波形聲音的主要參數包括:- 采樣頻率、量化位數、聲道數、壓縮編碼方案和數碼率等。
-
未壓縮前,波形聲音的數據量(碼率)的計算公式為:
波形聲音的碼率 = 采樣頻率 × 量化位數 × 聲道數 / 8。
- 波形聲音的碼率一般比較大,所以必需對轉換后的數據進行壓縮,常見的壓縮格式有MP3,MP4(MPEG-1 Audio Layer 3, 4)等。
- 聲音質量與它的頻率范圍有關
MIDI合成音頻(計算機合成的數字聲音、音樂)
- MIDI是樂器數字接口(Musical Instrument Digital Interface)的英文縮寫,也是數字音樂的國際標準,MIDI文件的擴展名為mid和mod。MIDI文件存儲的不是(自然現實的)聲音信號,而是音符、控制參數等指令。 MIDI標準規(guī)定了各種音調的混合及發(fā)音,播放時通過播放軟件或者音源的轉換,可以將這些數字合成為音樂。
圖形圖像處理技術
計算機中的圖像文件分為兩類,
- 一類是真實影像的數字化,稱為位圖,簡稱圖像(真實的);
- 另一類是計算機繪制的矢量圖形,簡稱圖形(虛擬的)。
圖像的數字化
-
圖像在空間和色彩(亮度)值上是連續(xù)變化的**,圖像數字化就是將連續(xù)色調的模擬圖像經采樣、量化、編碼后轉換成數字影像的過程。**
-
圖像的最小信息單位是像素(Pixel)
-
將一幅圖像等距劃分為
m行(橫軸)n列(縱軸)
,行列交叉的一個小方格稱作圖像的一個像素,一幅連續(xù)的模擬圖像經采樣數字化后稱作數字圖像,它是有一定密度的離散像素的集合,如1024* 768
的圖像 -
圖像分辨率指圖像中存儲的信息量,是每英寸圖像內有多少個像素點,分辨率的單位為PPI(Pixels Per Inch),通常叫做像素每英寸,分辨率越高,圖像質量越好(辨識度越高、越清晰)
-
一幅平面黑白圖像(灰度圖像)由m*n的二維平面矩陣表示
- 在第i行第j列的位置存儲像素(i, j)的灰度數值,8位2進制整型灰度等級取值為十進制
0-255
的整數值,也可化為0~1
的浮點數據
- 在第i行第j列的位置存儲像素(i, j)的灰度數值,8位2進制整型灰度等級取值為十進制
-
一幅平面彩色圖像由
m(行) x n(列) x 3(層)
的三維立體矩陣表示- 在第1層第i行第j列的位置存儲像素(i, j)的 紅色(Red) 顏色數值,8位2進制整型顏色等級取值為十進制
0-255
的整數值,也可化為0~1的浮點數據 - 在第2層第i行第j列的位置存儲像素(i, j)的 綠色(Green) 顏色數值,8位2進制整型顏色等級取值為十進制
0-255
的整數值,也可化為0~1的浮點數據 - 在第3層第i行第j列的位置存儲像素(i, j)的 藍色(Blue) 數值,8位2進制整型顏色等級取值為十進制
0-255
的整數值,也可化為0~1的浮點數據
- 在第1層第i行第j列的位置存儲像素(i, j)的 紅色(Red) 顏色數值,8位2進制整型顏色等級取值為十進制
-
一個像素點的顏色是RGB三元數組,
(r, g, b),如(0, 0, 0), (1, 1,1), (0, 0, 1), (255, 255, 0)
-
常見的圖像格式: BMP、JPG,GIF等;
-
常見的圖像處理軟件: Photoshop,ACD-see等等
-
圖像的采樣頻率是(行或列)分辨率,即單位長度(inch)內采集的樣本點數,單位是dpi(dot per inch),分辨率越高,圖像質量越好。
-
顏色深度是表示顏色(灰度)數目的二進制位數,位數越多,顏色數目越多,圖像色彩越逼真,常見有8位、16位、24位,當達到24位色時,可表現1677萬種顏色,稱為真彩色。
圖形
- 圖形一般指用計算機繪制的畫面。與圖像不同,在圖形文件中只記錄生成圖的算法和圖上的某些特點。
影像處理技術
影像信息包括動畫和視頻, 是 連續(xù)漸變的靜態(tài)圖像或圖形序列(一幀圖像或圖形), 沿時間軸按一定的速度順次更換(替代)顯示,從而構成運動視感的媒體。 當序列中每幀圖像是由人工或計算機產生的圖像時,常稱作動畫(虛構的);當序列中每幀圖像是通過實時攝取自然景象或活動對象時,常稱為影像視頻,或簡稱為視頻(現實的)。
多媒體數據壓縮技術
- 多媒體信號數據量大,給存儲容量、通信信道的帶寬以及計算機的運行速度增加了極大的壓力。通過數據壓縮(一般是采用新的編碼方案-壓縮編碼-即編碼的數學變換)手段,可以節(jié)約存儲空間,提高數據傳輸效率,使實時處理音頻、視頻信息成為可能。
- 壓縮方法分為有損壓縮和無損壓縮兩種類型。
超文本與超媒體
- 超文本和超媒體不是順序的,而是一個非線性的網狀信息鏈。 它把文本或其他媒體按其內部固有的獨立性和相關性劃分成不同的基本信息單元,稱為節(jié)點。
- 為了瀏覽超文本或超媒體,必須在用戶界面上標記能進一步瀏覽其他信息單元的指示器(pointer),即通常所稱的鏈(節(jié)點間的連接路徑、通道),節(jié)點之間使用鏈連接起來形成網狀結構。用戶可以通過點擊鏈快速打開鏈指向的信息,大大簡化了瀏覽信息的操作。
虛擬現實技術
虛擬現實
- 虛擬現實(Virtual Reality,VR)也稱靈境技術或人工環(huán)境,是一種由計算機技術輔助生成的現實世界的高技術模擬系統。
虛擬現實的概念
- 虛擬現實是一項綜合集成技術。它用計算機生成逼真的三維空間及視覺、聽覺、嗅覺等感覺通道, 使用戶作為參與者通過適當裝置、自然地融入虛擬世界并產生交互行為,獲取與真實環(huán)境類似的體驗和感受。
虛擬現實的特征
- 交互性(interactivity):用戶與環(huán)境的信息交流
- 沉浸感(immersion):身臨其境、沉浸其中,用戶與環(huán)境的一體化、無分離感
- 構想性(imagination):信息+行為,系統狀態(tài)變化為用戶提供可擴展的認知空間
虛擬現實需要解決的問題
- 以假亂真的存在技術
- 相互作用
- 自律性現實
虛擬現實技術
虛擬現實技術的概念
-
虛擬現實技術是指利用計算機生成一種模擬環(huán)境,并通過多種專用設備使用戶“投入”到該環(huán)境中,實現用戶與該環(huán)境直接進行自然交互的技術。
-
虛擬現實技術主要包括模擬環(huán)境、感知、自然技能和傳感設備等方面。
虛擬現實的關鍵技術
- 環(huán)境建模技術
- 立體聲合成和立體顯示技術
- 觸覺反饋技術
- 交互技術
- 系統集成技術
虛擬現實技術的應用
- 科技開發(fā)
- 商業(yè)
- 醫(yī)療
- 軍事
- 娛樂
補充題
當前最主流的人機交互方式是( )。
- 圖形用戶界面
運動的圖像屬于( )。
- 感覺媒體
我們從網上下載的MP3音樂,采用的聲音壓縮編碼標準是( ) 。
- MPEG-1層3
使用16位二進制編碼表示聲音與使用8位二進制編碼表示聲音的效果不同,前者比后者( ) 。
- 保真度高,音質好
對帶寬為300-3400Hz的語音,若采樣頻率為8kHz、量化位數為8位且為單聲道,則未壓縮時的碼率約為( )。
- 64kb/s
若波形聲音未進行壓縮時的碼率為64kb/s,已知取樣頻率為8kHz,量化位數為8,那么它的聲道數是( )。
- 1
表示R、G、B三個基色的二進位數目分別是6位、4位、6位,因此可顯示顏色的總數是( )種。
- 65536
獲取供計算機顯示或網頁上使用的圖像,以及制作3~5英寸以下的照片時,中低分辨率(1024×768或1600×1200)即可滿足要求,所以( )像素的數碼相機,原則上已能滿足普通消費者的一般應用要求。
- 100萬~200萬
數字圖像的獲取步驟大體分為四步:掃描、分色、取樣、量化,其中量化的本質是對每個樣本的分量進行( )轉換。
- A/D
靜止圖像壓縮編碼的國際標準有多種,下面給出的圖像文件類型采用國際標準的是( )。
- JPEG
黑白圖像的像素有( ) 個亮度分量。
- 1
使用8個二進制位存儲顏色信息的圖像能夠表示( ) 種顏色。
- 256
像素深度為6位的單色圖像中,不同亮度的最大數目為( )。
- 64
BMP圖像是微軟公司在Windows操作系統下使用的一種標準圖像文件格式,幾乎所有Windows應用程序都支持BMP文件。
-
是
在多媒體信息中包含大量冗余信息,把這些冗余信息去掉,就實現了壓縮。
- 是
超鏈的( )可以是文本中的任何一個字、詞或句子,甚至可以是一幅圖像。
- 鏈源
擴展名為.mid和.wav的文件都是PC機中的音頻文件。
- T
用MP3或MIDI表示同一首小提琴樂曲時,前者的數據量比后者小得多。文章來源:http://www.zghlxwxcb.cn/news/detail-797633.html
- F
GIF圖像文件格式能夠支持透明背景,具有在屏幕上漸進顯示的功能。文章來源地址http://www.zghlxwxcb.cn/news/detail-797633.html
- F
到了這里,關于計算機導論06-人機交互的文章就介紹完了。如果您還想了解更多內容,請在右上角搜索TOY模板網以前的文章或繼續(xù)瀏覽下面的相關文章,希望大家以后多多支持TOY模板網!