亚洲欧美精品沙发,日韩在线精品视频,亚洲Av每日更新在线观看,亚洲国产另类一区在线5

<pre id="hdphd"></pre>

  • <div id="hdphd"><small id="hdphd"></small></div>
      學習啦>論文大全>技術論文>

      多媒體技術論文怎么寫

      時間: 家文952 分享

        多媒體技術是一種把文本、圖形、圖像、動畫和聲音等形式的信息結合在一起,能完成一系列交互式操作的信息技術。學習啦小編為大家整理的多媒體技術論文,希望你們喜歡。

        多媒體技術論文篇一

        多媒體技術漫談

        摘要:這篇文章,主要是從宏觀上總結了一下現階段圖像視頻底層技術的發(fā)展及應用點,從一個圖像視頻算法研究人員的角度談一談對這個領域的認識。圖像視頻領域的商業(yè)應用,集中在多媒體娛樂、互聯網、智能監(jiān)控、工業(yè)機器視覺、OCR、生物特征識別、醫(yī)學圖像處理以及軍事國防幾個領域,多媒體領域是其中的一個重要分支,很多圖像視頻領域的新算法和新理論往往在多媒體領域得到最先的應用。

        關鍵詞:多媒體;視頻智能編輯;視頻感興趣區(qū);圖像視頻場景分析

        中圖分類號:TP37 文獻標識碼:A文章編號:1007-9599(2012)01-0000-02

        Multimedia Technology Study

        Du Pengxiang,Huang Shanshi

        (China Telecom Co.,Ltd.,Wenzhou Branch,Wenzhou325000,China)

        Abstract:This article is from the macro summarizes the development and application point of the current image video of the underlying technology from the perspective of an image of video algorithms researchers talk about the understanding of this area.The field of image and video business applications, multimedia entertainment,the Internet, intelligent monitoring,industrial machine vision,OCR,biometrics, medical image processing,as well as military defense in several areas, multimedia areas is an important branch of a lot of image field of video the new algorithms and new theories are often the first application in the multimedia field.

        Keywords:Multimedia;Video intelligent editing;Video interest region;Image video scene analysis

        多媒體領域主要集中了MicroSoft、Adobe、MITSUBISHI、Cyberlink、Muvee、Autodesk、Corel、Sony、2D3、MotionDSP等一批公司,以及與之相關的PAMI、IJCV、CVPR、ICCV、ECCV、SIGRAPH等眾多多高水平的學術期刊和學術會議。多媒體領域的研究方向比較雜,包括但不限于下面幾類,視頻智能編輯、視頻感興趣區(qū)、圖像視頻場景分析、圖像視頻修復及后處理、人臉系列技術、非真實感渲染(NPL)系列技術、3D系列技術、人機交互技術等。

        一、視頻智能編輯

        主要包括視頻鏡頭邊界檢測以及在此基礎上的視頻自動故事片生成、視頻廣告檢測、視頻廢鏡頭檢測等。視頻鏡頭邊界檢測在經歷了一段時間的發(fā)展之后,檢測率也達到一定的程度,目前基本上不再有新的文章出現。視頻自動故事片生成往往需要音視頻技術的結合,并且由于缺乏有效的評級機制,最近幾年已經不是研究的熱點,但是相信各個視頻編輯領域的公司仍在研究或者開發(fā)過程之中。視頻中的廣告檢測作為其中的一個小的分支,可能因為沒有很大的商業(yè)價值,研究的并不多,但想要真正實現高的檢測率,仍然有很多值得研究的地方。視頻廢鏡頭檢測其實是視頻修復的一部分,包括檢測視頻中的抖動片段、模糊片段、過曝過暗片段等,從而達到視頻修復的目的。

        (一)視頻感興趣區(qū)的研究

        最近是一個熱點方向,感興趣區(qū)提取和跟蹤可以用來做視頻智能縮放,可以用來指導視頻編輯中的精彩視頻片段選擇,還可以在片源采集時就用來指導攝像機捕捉精彩片段。人臉、人物、車輛、小動物、房屋、花草樹木等在特定的場景下等都可以作為感興趣區(qū),感興趣區(qū)提取的方式方法也比較多,但除了人臉、人物檢測技術上還比較成熟之外,其他目標的檢測很難達到滿意的準確度。人物檢測基礎上的精細分割摳像技術,也是圖像領域的一個基礎研究方向,準確的摳像,是換背景等智能化效果的基礎。

        (二)圖像視頻場景分析

        主要用在視頻管理和視頻按場景選擇和編輯。通過對不同的場景的特征進行分析設計分類器進行分類,對于視頻管理這種不要求很高精度的應用點可以滿足要求。照片和視頻按場景內容管理,跟基于人臉識別技術的照片管理,是基于內容管理的兩個方式,相信今后的多媒體編輯和管理軟件都會逐步增加這個功能。

        (三)圖像視頻的修復及后處理

        主要包括視頻抖動修復、圖像視頻去模糊、視頻過曝過暗修復、視頻去霧化、老電影舊照片修復、馬賽克修復、視頻圖像超分辨率、視頻圖像智能變比例縮放、視頻幀插值、圖像視頻去噪等。

        視頻抖動修復關鍵是攝像機軌跡的檢測,確定了攝像機的移動軌跡,視頻修復就有了基礎的指導。通過尋找視頻中的特征點,然后對特征點進行跟蹤,通過分析每個特征點的軌跡,確定攝像機的整體軌跡。如果假定視頻中的內容都是一個平面上,只考慮攝像機在2D平面的軌跡,事情要容易的多,但事實上攝像機的軌跡應該是3D的,這就變成了一個“Structure from Motion”的問題,處理起來就比較復雜,但如果想得到理想的穩(wěn)像效果,得出攝像機3D軌跡是必須的。另外,攝像機3D軌跡的求取,也是其他基于3D的視頻應用的基礎,這個后面再講。

        圖像視頻去模糊,這個的關鍵是尋找模糊核,也就是拍攝的瞬間攝像機或相機的運動軌跡,在這個運動軌跡上反卷積,就可以恢復攝像機不動情況下拍攝的視頻、圖像,也就是不模糊的視頻、圖像了。所以,對視頻的去模糊,比起對圖像的去模糊,手段要多一些,因為視頻去模糊可以通過視頻序列的信息來得到攝像機的運動軌跡。而圖像的去模糊,這個運動軌跡只能是通過對圖像內部結構的分析進行估計。考慮到軌跡估計和反卷積的運算量,不管是圖像去模糊還是視頻去模糊,目前都不算很成熟,但是成熟的產品應該會在短期內出現。

        視頻過曝過暗修復,如果視頻質量不是太差,直方圖被擠壓的不是太厲害,還可以通過直方圖均衡化的方式進行簡單修復,但是如果直方圖被擠壓的很嚴重,那就只能刪除了。

        視頻、圖像去霧化,簡單點說,就是把被霧化的圖像建模為一個正常的無霧的圖像與純霧的圖像的合成,因為拍攝得到圖像中霧的灰度值與景深有關,所以好的去霧算法,應該是以準確的景深估計為基礎的,3D景深估計也是一個很熱的方向。

        老電影舊照片修復,大概包括色彩的修復和一些劃痕修復,色彩修復,可以以類似去霧的建模方式,也可以簡單的做色調調節(jié),問題都不大。劃痕修復就比較復雜,除了要把劃痕檢測到,還要用周圍的像素來填充劃痕的像素,比較典型的全變分方法可以用來處理這類問題。

        馬賽克修復,馬賽克修復基本上還是要從產生的原因入手,如果是編解碼層的問題,可以對編解碼的數據嘗試修復。如果到了解碼后的圖像數據,想要修復就是一個無中生有的問題了,只能是依靠邊緣紋理來去掉馬賽克的效果,但是想要恢復圖像內容,除非后臺有一個強大的針對特定目標的數據庫來支持虛構類似的內容,否則毫無辦法。

        視頻、圖像超分辨率,超分辨率的方法,總體來說兩種思路,一種是挖掘圖像的邊緣信息,在圖像放大的時候,盡量保邊緣,這類方法以NEDI方法為典型,缺點是速度比較慢。另一類是基于Patch的方法,首先建立一個低分辨率Patch對應高分辨率Patch的映射表,前期先把這個映射關系建立好,然后就只需要通過查找映射表來進行超分辨率操作了。如果建立的映射表足夠大,那就可以得到比較理想的超分辨率結果,理論上講不論速度還是質量都比前一種方法要好。

        視頻圖像智能變比例縮放,是指通過分析圖像視頻中的內容,在圖像、視頻縮放的過程中,保留有內容的關鍵區(qū)域比例不變,而壓縮、擴展不重要的區(qū)域,這樣看起來縮放后的圖像、視頻主要內容不會變形?;趫D像的智能縮放算法比較成熟,基于視頻的由于要考慮視頻序列的前后幀的連續(xù)性,必須加入時間軸的約束,因此效果不如圖像理想,做的不好會引出視頻的抖動問題。

        視頻幀插值,可以用來解決幀率變化的情況下,出現的視頻抖動問題,主要是一個視頻的全局運動,類似于視頻抖動檢測,應該說技術上不復雜,但是視頻中的局部運動會干擾全局的運動估計,這樣插值出來的幀就會存在一定的瑕疵。

        圖像視頻去噪,方法很多,簡單點通過濾波高頻信號的方法如高斯濾波,或者簡單的中值濾波都可以有一定的效果,但是目前看來,最理想的方法還是非局部均值(NLM)方法。其他的一些例如偏微分方程的方法也可以嘗試。

        五、人臉系列技術

        包括人臉檢測、跟蹤,人臉特征點定位,人臉識別,人臉的表情識別,人的年齡、性別識別,人臉的美化,人臉卡通效果,人臉的變形效果,人臉的3D重建等以及與此相關的眼睛檢測和紅眼修復等。

        六、非真實感渲染(NPL)系列技術

        包括水墨畫、水彩畫、油畫、漫畫效果等人工畫效果,風、雪、雨、煙、霧、火焰、海浪等一些自然環(huán)境的模擬效果。

        人工畫效果的實現主要是基于Stroke的方式,難點在于圖像的解析,一個好的人工畫效果,需要正確的將圖像分解為不同的區(qū)域,并分析不同區(qū)域的結構特點來確定用筆方式、Stroke的精細度等參數。

        對自然環(huán)境的模擬,主要是一些粒子的模擬,可以采用基于物理模型的方式研究粒子的受力及運動方式,流體力學的相關方法是這個領域的核心。

        NPL技術,除了用于對圖像、視頻的特效上,另外像一些煙霧效果和水墨畫效果用于藝術字的特效也是不錯的選擇。

        七、3D系列技術

        3D技術在視頻中的應用點,可以看到的有3D穩(wěn)像、3D對象嵌入等等,這里的關鍵是獲取攝像機的3D軌跡與視頻中的特征點的3D深度信息,通過視頻序列分析攝像機的3D軌跡的技術叫“Structure from Motion”,大量的文章可以參考。有了攝像機的3D軌跡與視頻中的特征點的3D深度信息,2維的圖像信息就一定程度擴展到了3維。全景圖的拼接技術,本質上也利用了基于雙目視覺3維重構的一部分技術。得到了3D攝像頭軌跡,可以利用這個信息進行3D插幀,借此虛擬重構雙目視覺畫面,通過3D眼鏡,就可以看到比較理想的3D場景了。3D的應用,可以想象的空間比較大,多了一維信息,總可以做出一些新的東西。

        八、人機交互技術

        人機交互是指通過攝像頭捕捉人的手勢、身體的姿態(tài)、面部表情、眼睛的移動等信息,代替?zhèn)鹘y的鼠標鍵盤來指導計算機做出相應的處理。技術層面主要涉及目標的檢測、跟蹤以及姿態(tài)的識別。相比之前提到的多媒體的各種方向,人機交互應該是最有市場前景的方向,應用點也非常多。

        九、結論:

        除了上述的這些技術方向之外,在此基礎上或者與這些技術相關的一些其他的應用也可能不斷的出現,多媒體領域可以說是人工智能的一個試驗田,很多即使不成熟的新技術都很可能首先在這個領域出現和發(fā)展。這個領域幾乎可以囊括圖像視頻處理、模式識別的所有底層技術,必然可以衍生出很多很雜的應用點。

        多媒體技術論文篇二

        淺談多媒體技術

        摘要:多媒體技術是一種把文本、圖形、圖像、動畫和聲音等形式的信息結合在一起,并通過計算機進行綜合處理和控制,并且能完成一系列交互式操作的信息技術。它的發(fā)展改變了計算機的使用領域,廣泛應用于生產管理、教育教學、信息咨詢、廣告、家庭娛樂等領域。多媒體技術實現了通信技術、計算機技術、音像技術的緊密結合,它的研究涉及計算機軟硬件、網絡、人工智能、電子出版、通訊等多種技術。

        關鍵詞:多媒體技術 圖形 圖像

        中圖分類號:TP39 文獻標識碼:A 文章編號:1007-3973(2011)006-082-02

        多媒體技集文字、聲音、圖像、視頻、通信等多項技術于一體,采用計算機的數字記錄和傳輸傳送方式,對各種媒體進行處理,具有廣泛的用途,甚至可代替目前的各種家用電器,集計算機、電視機、錄音機、錄像機、VCD機、DVD機、電話機、傳真機等各種電器為一體,是一個涉及面極廣的綜合技術,是開放性的沒有最后界限的技術,其產業(yè)涉及電子工業(yè)、計算機工業(yè)、廣播電視、出版業(yè)和通訊業(yè)等。

        1 多媒體技術應用的意義

        多媒體技術發(fā)展到今天,已經對人類的現實生活產生了深遠的意義和影響,具體表現在以下幾個方面:一是使計算機可以處理人類生活中最直接、最普遍的信息,從而使得計算機應用領域及功能得到了極大的擴展。二是使計算機系統的人機交互界面更加友好方便,非專業(yè)人員可以方便地使用和操作計算機。這也使計算機的應用可以很快速的普及;三是多媒體技術使音像技術、計算機技術和通信技術三大信息處理技術緊密地結合起來,大大的促進了信息處理技術的發(fā)展,聲音、視頻、圖像壓縮方面的基礎技術已逐步成熟,并形成了產品進入市場,形成一個巨大的產業(yè)鏈。

        2 多媒體技術涉及的內容

        多媒體技術涉及的內容包括多媒體數據壓縮、多媒體處理、多媒體數據存儲、多媒體開發(fā)工具等。下面加以簡單介紹:

        多媒體數據壓縮涉及多模態(tài)轉換、壓縮編碼;多媒體處理主要是音頻信息處理,如音樂合成、語音識別、文字與語音相互轉換;

        多媒體數據存儲主要涉及數據庫技術,這里指多媒體數據庫,如圖像處理會產生大量數據,就要考慮數據庫存儲技術;

        多媒體開發(fā)工具:第一種是基于時間的,它以可視的時間軸來決定事件的順序和對象上演的時間。這種時間軸包括許多行道或頻道,以使安排多種對象同時展現。比如Director和Action;第二種是基于圖符或流線的,它把多媒體成分和交互隊列(事件)按結構化框架或過程組織為對象。使項目的組織方式簡化且多數情況下是顯示沿各分支路徑上各種活動的流程圖。比如Authorware;第三種是基于卡片或頁面的,它提供一種可以將對象連接于頁面或卡片的工作環(huán)境,一頁卡片便是數據結構中的一個節(jié)點,它類似于教科書中的一頁或數據袋內的一張卡片,如HyperCard;第四種是以傳統程序語言為基礎的,需要用戶編程量較大,而且重用性差、不便于組織和管理多媒體素材、調試困難,如VB、Delphi等。

        3 主要多媒體技術的發(fā)展狀況

        多媒體技術的發(fā)展狀況可以從以下幾個方面分析:

        (1)音頻技術。音頻技術主要包括四個方面:音頻數字化、語音處理、語音合成及語音識別。

        音頻數字化目前是較為成熟的技術,多媒體聲卡就是采用此技術而設計的,在這種技術的支持下,數字音響一改傳統的模擬方式而達到了理想的音響效果。音頻采樣包括兩個重要的參數即采樣頻率和采樣數據位數。采樣頻率即對聲音每秒鐘采樣的次數,采樣頻率越高音質越好,存貯數據量越大。采樣數據位數即每個采樣點的數據表示范圍,目前常用的有8、12和16位三種。采樣位數越高,存貯數據量越大,音質也越好。

        語音處理主要集中在音頻壓縮上,目前最新的MPEG語音壓縮算法可將聲音壓縮六倍。

        語音合成又稱文語轉換(Textto Speech)技術,它能將任意文字信息實時轉化為標準流暢的語音朗讀出來,相當于給機器裝上了人工嘴巴。涉及聲學、語言學、數字信號處理、計算機科學等多個學科技術。

        語音識別在音頻技術中難度最大最吸引人,就是讓機器通過識別和理解過程把語音信號轉變?yōu)橄鄳奈谋净蛎畹母呒壖夹g。語音識別技術主要包括特征提取技術、模式匹配準則及模型訓練技術三個方面。讓計算機聽懂人說話是發(fā)展人機語音通信和新一代智能計算機的主要目標。

        (2)視頻技術。視頻技術包括視頻數字化和視頻編碼技術兩個方面。視頻數字化是將模擬視頻信號經模數轉換和彩色空間變換轉為計算機可處理的數字信號,使得計算機可以顯示和處理視頻信號。視頻數字化后色彩、清晰度及穩(wěn)定性都有了明顯的提高。視頻編碼技術是將數字化的視頻信號經過編碼成為電視信號,從而可以在電視上播放。

        (3)圖像壓縮技術。圖像壓縮一直是技術熱點,是計算機處理圖像和視頻以及網絡傳輸的重要基礎,目前有三個壓縮標準即JPEG、MPEG和H.26。

        JPEG是國際上彩色、灰度、靜止圖像的第一個國際標準,它不僅適于靜態(tài)圖像的壓縮,電視圖像序列的幀內圖像的壓縮編碼,也常采用JPEG壓縮標準。它包括兩部分:一是基于DPCM(空間線性預測)技術的無失真編碼,一是基于DCT(離散余弦變換)和哈夫曼編碼的有失真算法。前者圖像壓縮無失真,但是壓縮比很小,目前主要應用的是后一種算法,圖像有損失但壓縮比很大,壓縮20倍左右時基本看不出失真。MPEG是針對運動圖像的數據壓縮技術。目前又分為MPEG-I、MPEG-II、MPEG-IV、MPEG-7和MPEG-21。它除了對單幅圖像進行編碼以外還利用圖像序列中的相關原則,將幀間的冗余去掉,這樣大大提高了圖像的壓縮比例。H.26是視頻圖像壓縮編碼國際標準,主要用于視頻電話和電視會議,可以以較好的質量來傳輸更復雜的圖像。

        4 多媒體技術應用領域

        多媒體技術的應用領域非常廣泛,涉及農業(yè)生產、軍事、旅游、互聯網、家庭娛樂、電子地圖、網絡通信、辦公自動化、航空航天、生產管理、教育教學、信息咨詢、商業(yè)廣告等等,下面從幾個方面進行簡單說明:

        (1)教育和娛樂:它可能是多媒體技術應用最多的一個領域,一般的游戲都使用了動畫,三維圖形,視頻播放,聲音處理等技術,還有影視娛樂業(yè)中的電影特技、變形效果,電視/電影/卡通混編特技、MTV特技制作、仿真游戲。在教育方面,多媒體技術主要體現在形象教學、模擬展示上,比如電子教案、形象教學、模擬交互過程、網絡多媒體教學、仿真工藝過程等,這使得教學過程具有很好的交互性,并可用逼真的形象表現所需的信息。

        (2)商業(yè)廣告:是另一種對多媒體技術需求較多的應用領域,主要體現在特技合成、大型演示中,象影視商業(yè)廣告、公共招貼廣告、大型顯示屏廣告、平面印刷廣告等,這里要用到視頻捕捉、圖像壓縮與解壓縮、圖像編輯與轉換、音頻同步,添加字幕等技術。

        (3)虛擬現實技術和遠程傳輸:它可以用來模擬復雜的動作和仿真,利用計算機和其它的相關設備將人們帶入一個虛擬的世界。虛擬現實技術體現在人工智能模擬上,象生物形態(tài)模擬、生物智能模擬、人類行為智能模擬,比較典型的例子就是駕駛訓練系統,它就使用了虛擬現實技術;多媒體技術在遠程傳輸上的最成功表現就是多媒體在Intemet上的應用,它突破了Intemet只能傳輸字符的限制,從而展示給遠處一個接近現實的畫面,這在醫(yī)療上體現了具大的作用,象遠程診斷、遠程手術。

        多媒體技術在上述應用領域發(fā)展的過程中,不僅促進了多媒體軟件的發(fā)展,同時也促進了多媒體硬件的發(fā)展。對于軟件來說,可以分成以下幾類:

        文字處理:記事本、寫字板、Word、WPS

        圖形圖像處理:PhotoShop、CorelDraw、Freehand等;

        動畫制作:AutoDesk、Animator Pro、3DS MAX、Maya、Flash等;

        聲音處理:Ulead Media Studio、Sound Forge、Audition(Cool Edit)、Wave Edit等;

        視頻處理:Ulead Media Studio、Adobe Premiere等;

        對于硬件來說,不僅聲頻卡(Audio Card)、光盤(CD-ROM)、視頻卡(Video Card)等這些基本產品得到了廣泛的發(fā)展,其它的硬件設備如攝像機、掃描儀、觸摸屏、打印機、影碟機、音響設備等也得到快速的發(fā)展和廣泛的普及,這些產品已走進平常百姓家,給人們帶來了很多生活樂趣。

        參考文獻:

        [1]尹敬齊,多媒體技術[M],機械工業(yè)出版社

        [1]沈大林,多媒體CAI課件制作案例教程[M],中國鐵道出版社

        
      看了“多媒體技術論文怎么寫”的人還看:

      1.淺談計算機多媒體技術畢業(yè)論文

      2.計算機多媒體技術論文

      3.計算機多媒體技術研究畢業(yè)論文范文

      4.計算機多媒體技術教學畢業(yè)論文范文

      5.淺議多媒體教學論文

      多媒體技術論文怎么寫

      多媒體技術是一種把文本、圖形、圖像、動畫和聲音等形式的信息結合在一起,能完成一系列交互式操作的信息技術。學習啦小編為大家整理的多媒體技術論文,希望你們喜歡。 多媒體技術論文篇一 多媒體技術漫談 摘要:這篇文章,主要是從宏觀
      推薦度:
      點擊下載文檔文檔為doc格式
      2316204