Skip to content
ℕ𝔸𝕊𝔸™ℕ𝕒𝕤𝕒𝕣𝕖™𝕊𝕡𝕒𝕔𝕖𝕏™ https://nasa.re/

Nasare™🚀

フレッシュ スペース & テクノロジー NEWS📢

  • About 𝒩𝒶𝓈𝒶𝓇𝑒™
  • SMART Tools
  • SMART AI
    • Kubeshark PCAP Export/Import
    • Coaching engineering managers to employ on organizational issues
    • Zelda: Hyperlink’s Awakening game engine documentation (2021)
    • Commercial Resupply Services-CRS
  • Show HN
    • WINd3x、iPod Bootrom エクスプロイトは 10 年遅かった
    • Just by Notでプログラミングするシステム オブジェクト指向プログラミングの活用
    • 主な BGP 増加をレジデンス Windows デスクトップに追加する
    • ガジェットの複雑さが増し、余分な IP の再利用が促進される
    • 新しい GitHub CLI 拡張インストゥルメント
    • Kubernetes を 7,500 ノードにスケーリング (2021 年)
    • Wander アプリ用の軽量なオンザフリット構成ライブラリ
    • Ask HN
      • Declare HN: I wrote a WebAssembly Interpreter and Toolkit in C
      • Describe HN: Kandria, an action RPG made in Frequent Voice, is now out
      • Demonstrate HN: ClickHouse-local – a runt instrument for serverless files analytics
      • Brand HN: Motion photographs Watchlist Chrome Extension
      • Existing HN: Connmap – Desktop widget that reveals your TCP company on an international diagram
      • Level to HN: An initiate source tool to generate Jet Engine compressors
      • Insist HN: Ov – characteristic smartly off terminal pager
      • Level to HN: Graphic-Walker – A special kind of originate-offer different to Tableau
      • Level to HN: A corpulent game of snake encoded in a url
      • Point out HN: Kweb: A a ways away interface to the earn browser’s DOM
      • Present HN: Nanelo DNS – Privacy-Kindly, European Nameservers
      • Reward HN: Vim on-line editor the exercise of WebAssembly, storing files the exercise of IndexedDB
      • Show HN: AREnets – TensorFlow-basically based mostly Relation Extraction equipment for work in Colab
      • Speak HN: What sub $200 product improved HN readers’ 2022
      • Uncover HN: Easy internet app for teenagers to management a single Philips Hue light
      • Advise HN: Daft Art – an album veil maker powered by AI and curated aesthetics
    • Show HN
      • Reward HN: Vim on-line editor the exercise of WebAssembly, storing files the exercise of IndexedDB
      • Android phones will at the moment obtain iPhone-love SOS satellite texting
      • Demonstrate HN: ClickHouse-local – a runt instrument for serverless files analytics
      • Show HN: AREnets – TensorFlow-basically based mostly Relation Extraction equipment for work in Colab
      • Present HN: Nanelo DNS – Privacy-Kindly, European Nameservers
      • Insist HN: Ov – characteristic smartly off terminal pager
      • Level to HN: An initiate source tool to generate Jet Engine compressors
      • Speak HN: What sub $200 product improved HN readers’ 2022
      • Advise HN: Daft Art – an album veil maker powered by AI and curated aesthetics
      • Uncover HN: Easy internet app for teenagers to management a single Philips Hue light
      • Level to HN: A corpulent game of snake encoded in a url
    • Brand HN: Motion photographs Watchlist Chrome Extension
    • Existing HN: Connmap – Desktop widget that reveals your TCP company on an international diagram
    • Point out HN: Kweb: A a ways away interface to the earn browser’s DOM
    • Declare HN: I wrote a WebAssembly Interpreter and Toolkit in C
    • Tag HN: Using Key-Value Retail outlets in Serverless Codehooks.io Applications
    • Declare HN: I wrote a WebAssembly Interpreter and Toolkit in C
    • Point out HN: Kweb: A a ways away interface to the earn browser’s DOM
    • Existing HN: Connmap – Desktop widget that reveals your TCP company on an international diagram
    • Brand HN: Motion photographs Watchlist Chrome Extension
    • Level to HN: A corpulent game of snake encoded in a url
    • Uncover HN: Easy internet app for teenagers to management a single Philips Hue light
    • Advise HN: Daft Art – an album veil maker powered by AI and curated aesthetics
    • Speak HN: What sub $200 product improved HN readers’ 2022
    • Level to HN: An initiate source tool to generate Jet Engine compressors
    • Level to HN: Graphic-Walker – A special kind of originate-offer different to Tableau
    • Insist HN: Ov – characteristic smartly off terminal pager
    • Present HN: Nanelo DNS – Privacy-Kindly, European Nameservers
    • Show HN: AREnets – TensorFlow-basically based mostly Relation Extraction equipment for work in Colab
    • Demonstrate HN: ClickHouse-local – a runt instrument for serverless files analytics
    • Reward HN: Vim on-line editor the exercise of WebAssembly, storing files the exercise of IndexedDB
  • A Computer virus and a Dilemma
    • OCIS – OwnCloud Countless Scale
    • A Princeton student built an app which is ready to detect if ChatGPT wrote an essay
    • GitHub Is Sued, and We Would possibly perhaps Learn Something About Creative Commons Licensing
    • Adobe’s Command material analysis can be using photos/videos to narrate AI w/o consent
    • Ultralearning a.k.a. how I learned to code
    • Automatic1111 is assist on GitHub after taking away Embedding Links
    • Where Your Sides Came From
    • What Is a Pig Butchering Rip-off?
    • Submit-processing is ruining iPhone photos
    • Clos Topologies and Centralized Retain a watch on in Google’s Datacenter Community
    • Miller Engineering DS-1 House Planetarium
    • Gimel Studio: Non-harmful, 2D image editor
  • Technology
    • Miller Engineering DS-1 House Planetarium
    • Apple Doctors: to construct it as a file it is advisable to electronic mail it to your self
    • The Air India passenger who urinated on a girl has been fired by Wells Fargo
    • The Filesystem Hierarchy Usual Comes to Guix Containers
    • Sooner than it sued Google for copying from Java, Oracle changed into as soon as copying IBM’s SQL (2020)
    • The i3-gaps mission has been merged with i3
    • Making an Alphorn from Scratch
    • Apple: Braille Individual Guides
    • MotherDuck Is a Original Thought
    • The class of CGI and simple make
    • Like a mercurial tour of DragonFly BSD 6.4?
    • computer science
    • AI
    • Artificial intelligence
    • Technology
    • Ai
    • Apple
    • digital
  • TOP HN
    • anti-Mastodon
    • TOP HN
      • Show HN
      • Ask HN
      • coding
      • ガジェットの複雑さが増し、余分な IP の再利用が促進される
      • 新しい GitHub CLI 拡張インストゥルメント
      • Kubernetes を 7,500 ノードにスケーリング (2021 年)
      • Just by Notでプログラミングするシステム オブジェクト指向プログラミングの活用
      • Describe HN: Kandria, an action RPG made in Frequent Voice, is now out
      • WINd3x、iPod Bootrom エクスプロイトは 10 年遅かった
      • Wander アプリ用の軽量なオンザフリット構成ライブラリ
      • Artificial intelligence
      • 主な BGP 増加をレジデンス Windows デスクトップに追加する
      • Technology
      • Level to HN: Graphic-Walker – A special kind of originate-offer different to Tableau
      • Declare HN: I wrote a WebAssembly Interpreter and Toolkit in C
      • Point out HN: Kweb: A a ways away interface to the earn browser’s DOM
      • Existing HN: Connmap – Desktop widget that reveals your TCP company on an international diagram
      • Advise HN: Daft Art – an album veil maker powered by AI and curated aesthetics
      • Brand HN: Motion photographs Watchlist Chrome Extension
      • Declare HN: I wrote a WebAssembly Interpreter and Toolkit in C
      • Demonstrate HN: ClickHouse-local – a runt instrument for serverless files analytics
      • Describe HN: Kandria, an action RPG made in Frequent Voice, is now out
      • Existing HN: Connmap – Desktop widget that reveals your TCP company on an international diagram
      • Insist HN: Ov – characteristic smartly off terminal pager
      • Just by Notでプログラミングするシステム オブジェクト指向プログラミングの活用
      • Kubernetes を 7,500 ノードにスケーリング (2021 年)
      • Level to HN: A corpulent game of snake encoded in a url
      • Level to HN: An initiate source tool to generate Jet Engine compressors
      • Level to HN: Graphic-Walker – A special kind of originate-offer different to Tableau
      • Point out HN: Kweb: A a ways away interface to the earn browser’s DOM
      • Present HN: Nanelo DNS – Privacy-Kindly, European Nameservers
      • Reward HN: Vim on-line editor the exercise of WebAssembly, storing files the exercise of IndexedDB
      • Show HN: AREnets – TensorFlow-basically based mostly Relation Extraction equipment for work in Colab
      • Speak HN: What sub $200 product improved HN readers’ 2022
      • Uncover HN: Easy internet app for teenagers to management a single Philips Hue light
      • Wander アプリ用の軽量なオンザフリット構成ライブラリ
      • WINd3x、iPod Bootrom エクスプロイトは 10 年遅かった
      • ガジェットの複雑さが増し、余分な IP の再利用が促進される
      • 主な BGP 増加をレジデンス Windows デスクトップに追加する
      • 新しい GitHub CLI 拡張インストゥルメント
      • ロンドンで*ダウン*を継続的に見つめる: Pavement Oddities
      • 報酬 HN: C の 30 行でスピンロック
      • FAA の NOTAM とは何ですか? 航空専門家が機械の仕組みを説明
      • ナノGPT
      • 1 ビット LCD のグレースケール (2022)
      • The Muse (YC W12) は FP&A のシニア ディレクターを採用しています
      • Zen (YC S21) はグロース エンジニアを採用しています
      • Tall Inquire of (YC W21) が B2B 回顧録の幹部を採用
      • Actiondesk (YC S19) は、プロダクト ドレスメーカーを採用しています (4-6 か月の契約)
      • Oven (YC S19) は、Bun を作成するために C/C++ または Zig エンジニアを採用しています。
      • WInd3x, the iPod Bootrom exploit 10 years too unhurried
      • Sign HN: FASTA recordsdata を操作するための FUSE モジュール
      • HN を指します: Socketify.py: PyPy3 および Python3 用の Http/Https および WebSocket サーバー
      • Wage Development Continues to Gradual in the UK and Euro House
      • Stage Supervisor for the unimpressed: 1 Getting started
      • First public free up of Pushup: a brand unique compiler for making net apps in Trip
      • Fixing Cart-Pole Swingup with a Hierarchical Controller
      • Flight Testing the Touchdown Radar for Mars Science Laboratory 2011-06-21T17:36:36Z
      • Flightcontrol (YC W22) is hiring first Developer Recommend
      • Flying boats and other tech for cleaner shipping
      • Four Finalist Touchdown Location Candidates for Mars Science Laboratory 2008-11-19T16:21:01Z
      • France’s prized nuclear sector stalled in Europe’s hour of want
      • French startup unveils new residential thermo-acoustic warmth pump
      • FTC Cracks Down on Firms That Impose Contaminated Noncompete Restrictions
      • FTX’s Aged Prime Lawyer Aided US Authorities in Bankman-Fried Case
      • FY18 NASA lėšų šnypštimas 2017-05-22T00:00:00Z
      • G-3PO: A protocol droid for Ghidra, or GPT-3 for reverse-engineering
      • Gail.com FAQ
      • Gemini-Titan (GT)-6 – Gemini 6 of 7 – 지역 사진 – 외부 지역 1965-12-15T00:00:00Z
      • Geoffrey Hinton Publishes Original Deep Learning Algorithm
      • Germany warns: AI fingers flee already underway (2021)
      • Gimel Studio: Non-harmful, 2D image editor
      • GitHub Availability File
      • GitHub Is Sued, and We Would possibly perhaps Learn Something About Creative Commons Licensing
      • Google needs RISC-V to be a “tier-1” Android architecture
      • Google researcher, lengthy out of math, cracks devilish dispute about gadgets
      • Google start sourced CDC File Transfer from the ashes of Stadia
      • GRC-2003-C-02097 2004-05-01T00:00:00Z
      • GRC-2013-C-05246 2009-11-26T00:00:00Z
      • Hello world!
      • Highlights of Science Launching on SpaceX CRS-15 2018-06-24T00:00:00Z
      • Hilf Al-Fudul
      • HiOperator (YC S16) Is Hiring VP of Engineering
      • HN を指します: Socketify.py: PyPy3 および Python3 用の Http/Https および WebSocket サーバー
      • How kind I blueprint a pair of buttocks?
      • How will the haj switch as international temperatures upward thrust?
      • Human gene linked to bigger brains turned into as soon as born from apparently pointless DNA
      • Hundreds of scientists publish a paper every 5 days
      • In Favor of Friction and Flexibility
      • Indicate HN: Klotho – Change into straightforward code into cloud native code
      • Indoor farming isn’t exact for the smartly off
      • Iranian assault drone came across to have parts from more than a dozen US companies
      • Israeli researcher experiences leak of 235M Twitter-linked e-mail addresses
      • Jam Stations in Low Earth Orbit
      • Jazz Is Freedom
      • JPL-20171102-TECHf-0001-ドローントリップ 人間vs機械 2017-11-17T00:00:00Z
      • JPL에서 NASA의 MSI 콘도미니엄 액셀러레이터 2022-08-25T00:00:00Z
      • JPSO extinct facial recognition abilities to arrest a man. The tech modified into once defective
      • jsc2017e136097 – 12 月 4 日,俄罗斯联邦地区公司 (Roscosmos) 的远征 54-55 号机组人员 Anton Shkaplerov 在俄罗斯 Principal person City 的加加林宇航员训练中心上向整洁的祝福者挥手致意,当时他登上了前往附近的 Chkalovsky Ai 的公共汽车2017-12-04T00:00:00Z
      • Kemble’s Cascade of Stars
      • Kepler-90 マシン (アーティストの考え) 2017-12-14T00:00:00Z
      • Koichi Wakata SpaceX 코칭 2022-06-27T00:00:00Z
      • KSC and Proud to Be Heart-Wide Diversity Tournament 2019-08-20T00:00:00Z
      • KSC ir „Proud to Be Center“ įvairovės turnyras 2019-08-20T00:00:00Z
      • AI
      • Artificial intelligence
      • Auto-Generate
      • anti-Mastodon
      • Awesome
      • BioSentinel
      • CATEGORIES
      • DC
      • Dione
      • Diversity
      • drone racing
      • drones
      • Dulles
      • education
      • Event
      • filmstock
      • Goddard
      • AI
      • Ask HN
      • autonomous
      • coding
      • computer science
      • Clusters
      • Artificial intelligence
        • Ai
        • Apple
        • Tesla
        • digital
        • MESSENGER
        • Device
        • Charts
        • change
        • Shows
        • fraud
        • Former
        • fucking
        • purge
        • Works
        • entering
        • Databases
        • Review
        • Strangely
        • Instinct
        • staff
        • Salesforce
        • intern
        • Involuntary
        • promise
        • Twilio’s
        • nisv live
        • attack
        • Iranian
        • France’s
        • prized
        • infrastructure
        • Debian-based
        • nisv s02 ep03
        • siduction
        • Awesome
        • Calculate
        • Beautiful
        • Linux
        • Start
        • dollar
        • Messier
        • Daughters
        • ‘Breakthrough’
        • obesity
        • Al-Fudul
        • sixty years
        • PyTorch
        • discloses
        • Ancient
        • Stone
        • Popup
        • design
        • public
        • expanding
        • cloud
        • forest
        • startup
        • French
        • batteries
        • fleas
        • spotted
        • Petals
        • language
        • Habitual
        • checking
        • GitHub
        • Availability
        • layers
        • inconsistencies
        • Affair
        • Quasi-War
        • Sergey
        • Irate
        • bestseller
        • necessarily
        • Scientists
        • Titan
        • twitch
        • FGS/NIRISS – Fine Guidance Sensor/Near InfraRed Imager and Slitless Spectrograph
        • infrared
        • ISIM – Integrated Science Instrument Module
        • JHU – Johns Hopkins University
        • JWST – James Webb Space Telescope
        • JWST – James Webb Space Telescope
        • absolute zero
        • Big Bang
        • Peace
        • Studio
        • Making
        • project
        • -gaps
        • warns
        • Germany
        • Braille
        • MotherDuck
        • prototype
        • Challenges
        • Infinite
        • OwnCloud
        • Novel
        • Before
        • copying
        • California
        • getting
        • States
        • Criminal
        • Brother
        • Released
        • Method
        • owners
        • ‘richsession’
        • email
        • Elements
        • Where
        • passenger
        • Hierarchy
        • Filesystem
        • economic
        • Crew Dragon
        • Bridenstine
        • Scientific
        • Heaviosity
        • Patterns
        • Unexpected
        • minimalist
        • Ecode
        • Alpha
        • Wolfram
        • Tailwind
        • HiOperator
        • Klotho
        • TEAMS
        • ROBOTICS
        • Antelope
        • Sponsors
        • Ellen Gertsen
        • Transform
        • Flightcontrol
        • subscriptions
        • Internet
        • Theory-building
        • you’re
        • looking
        • Transfer
        • error’
        • Tails
        • migrate
        • Building
        • Bitmovin
        • Remote
        • PhotoRoom
        • Company
        • Taking
        • Ribbon
        • BibDesk
        • Android
        • profilers
        • phones
        • modern
        • Mastercard
        • private
        • We’ve
        • reportedly
        • Microsoft
        • Artsy
        • trades
        • skilled
        • Polygon
        • Flying
        • Princeton
        • Codemods
        • Coaching
        • UK’s
        • popping
        • sourced
        • Wikipedia
        • admin
        • Indoor
        • quick
        • Mysterious
        • Spotify
        • Fancy
        • Spotify
        • Weird
        • mail-order
        • Recipients
        • computer
        • optics
        • partnership
        • commercial
        • telemetry
        • Crisis
        • billionaire
        • Party
        • Onelab
        • Faster
        • general
        • Adobe’s
        • database
        • FinanceDatabase
        • Numerical
        • Freedom
        • concrete
        • Stacks
        • computer science
        • NASA
    • Show HN
    • Ask HN
    • Technology
    • computer science
    • coding
    • Clusters
    • AI
    • drones
    • autonomous
    • Auto-Generate
    • Ask HN
    • Show HN
    • The SMART Science™
    • google
  • CRYPTO
    • Blockchain
    • farming
    • Billionaires
    • FTX’s
    • FinanceDatabase: A database of 300.000 symbols (ETFs, Currencies, Crypto)
  • Artificial intelligence
  • Toggle search form
  • より高速で小規模な更新のための最新の F-Droid リポジトリ形式
    より高速で小規模な更新のための最新の F-Droid リポジトリ形式 Artificial intelligence
  • Wheels and Suspension on Mars Science Laboratory Rover 2008-11-19T16:21:01Z
    Wheels and Suspension on Mars Science Laboratory Rover 2008-11-19T16:21:01Z 𝙱𝚒𝚘 𝙴𝚡𝚙𝚎𝚛𝚒𝚖𝚎𝚗𝚝𝚜™
  • Heroku フィードバックとニュース – 第 1 四半期版
    Heroku フィードバックとニュース – 第 1 四半期版 anti-Mastodon
  • ヨーロッパで初めて馬コロナウイルス(ECoV)が検出された
    ヨーロッパで初めて馬コロナウイルス(ECoV)が検出された anti-Mastodon
  • かなりの解像度: 画像から画像への変換 ArcGIS Pro での Deep Discovering の費用
    かなりの解像度: 画像から画像への変換 ArcGIS Pro での Deep Discovering の費用 Artificial intelligence
  • ケース 考慮事項: PostgreSQL Geospatial Indexing による地理空間検索の最適化
    ケース 考慮事項: PostgreSQL Geospatial Indexing による地理空間検索の最適化 anti-Mastodon
  • Uber Cadence however with correct about a Java LOC on Kafka – workflow as code
    Uber Cadence however with correct about a Java LOC on Kafka – workflow as code Technology
  • Postgres 向けの Citus 11.2 の新機能と、Citus 向けの Patroni 3.0 HA 強化
    Postgres 向けの Citus 11.2 の新機能と、Citus 向けの Patroni 3.0 HA 強化 anti-Mastodon
  • This image was taken by NASA’s EPIC camera onboard the NOAA DSCOVR spacecraft 2023-01-04 09:13:14
    This image was taken by NASA’s EPIC camera onboard the NOAA DSCOVR spacecraft 2023-01-04 09:13:14 image
  • メタのチーフ AI サイエンティストは、ChatGPT はもはや革新的でも革新的でもないと述べました
    メタのチーフ AI サイエンティストは、ChatGPT はもはや革新的でも革新的でもないと述べました anti-Mastodon
  • The infrastructure in the serve of ATMs
    The infrastructure in the serve of ATMs Artificial intelligence
  • DARPA funding WhisperBeam vitality-beaming plane
    DARPA funding WhisperBeam vitality-beaming plane anti-Mastodon
  • BASICを勉強中 ふけるまたはもう1983年ではありません(2018)
    BASICを勉強中 ふけるまたはもう1983年ではありません(2018) anti-Mastodon
  • Carpalx – キーボード レイアウト オプティマイザー
    Carpalx – キーボード レイアウト オプティマイザー anti-Mastodon
  • 画面 HN: PostgreSQL での True Records の変更
    画面 HN: PostgreSQL での True Records の変更 Awesome
Loongson の LSX および LASX ベクトル拡張

Loongson の LSX および LASX ベクトル拡張

Posted on February 26, 2023 By 📢 Julian Assange

Loongson は以前、MIPS ISA にほぼ完全に基づいた CPU を発明しましたが、最近では Loongarch として知られる自社開発の ISA に切り替えていました。 この「最近の」ISA は、MIPS のセマンティクスのかなりの量を保持していますが、互換性のないエンコーディングを使用しています。 Loongarch はまた、実行可能な中国国内の CPU を構築するという Loongson の夢をより高く、より強力にするために長期化します。

Loongarch の LSX および LASX ベクトル拡張は、この顕著な例です。 LSX は、128 ビットのベクトル レジスタと対応する命令を備えた x86 上の SSE に比較的優れています。 LASX は、すべての拡張機能が 256 ビット ベクトルで動作するため、AVX2 とは対照的です。 SSE および AVX2 との不公平さから、LSX および LASX はもはや公に文書化されていません。 繰り返しになりますが、Loongnix は LSX/LASX の満足できるツールチェーンを提供しています。 これは、LSX と LASX の検査命令を所有して、それらをいじることができることを意味します。 私はこれらの ISA 拡張機能を完全にファイルする時間がないので、この記事では注目を集める重要なポイントをいくつか取り上げます.

暫定的な紹介

LSXは VR31 によって VR0 という名前の 128 ビット レジスタを提供し、LASX は XR31 によって XR0 という名前の 256 ビット レジスタを提供します。 SSE と AVX には本当に感服します。これらのレジスタは、それぞれにエイリアス化されています。 これらは 64 ビット FP レジスタ (F0 から F31) にもエイリアスされます。 つまり、F1 は XR1 の下位 64 ビットを指し、VR1 は下位 128 ビットを指します

。

Loongson LASX と x86-64 AVX で異なるレジスタ名が同じレジスタにエイリアスされる例。 ベクタ レジスタ 1 は、F1、VR1、または XR1 のプロセスによってさらに参照され、異なる幅へのエントリを取得することもできます。

すべての LSX と LASX は、ベクトルを操作するための異なる命令を提供します。 ファッショナブルなものは、ベクトルの足し算、掛け算を賞賛し、常識的な操作は、あなたが焦点を当てていることを正確に実行します。 浮動レベルの命令は FP32 または FP64 の両方のパーツで機能しますが、整数の命令は 8 ビット、16 ビット、32 ビット、または 64 ビットのパーツで機能します。 もちろん、128 ビットと 256 ビットのロード/ストア命令もあります。

算術命令のほかに、LASX には並べ替え、最小/最大、絶対コスト、およびロード アンド ブロードキャスト (何らかの目的で XVLDREPL として知られている) の命令があります。 間違いなく、これらのいずれかが決定された AVX2 相当物を所有していません。 今日を取り、対応する啓発の瞬間とすべての側面の最大値を返す最大命令(XVMAXI)のバリアントがあります。 その命令が5ビットの自己規律を使用してインスタントを2の補数の符号付きコストとしてエンコードするという事実にもかかわらず、それは適度に注目を集めています.15(または-15 より小さい)。 ファイル スクートの場合、LASX には、指定されたベクター レーンの値を reminiscence または GPR に渡す命令があります。ベクトル操作の有益な保護があります。 あたかも欠けているように見える明示的なものについては、ビデオエンコードを高速化するための絶対的な違いの合計を賞賛してください。

命令のエンコード例

レジスタをエンコードしたMIPSとは不公平命令の中心である Loongarch は、レジスタ フィールドを最も重要度の低いビットに打ち込みます。 それは LSX と LASX にも当てはまります。 MIPS の伝統に歩調を合わせて、LSX/LASX 命令は非敵対的です。この機能は、プロビジョン レジスタ間で間違いなく上書きすることを好みません。 これは、融合乗算演算が FMA4 と同一であり、4 つのレジスタ フィールドが必要であることを意味します。 Loongarch は固定次元を使用するため、32 ビット命令は MIPS をかなり賞賛します。オペコードの自己規律は、3 つのレジスタ オペランドよりも多くのエンコーディングを有効にするために可変次元になるようです。

Loongarch LSX/LASX エンコーディングがどのようなものであるかを推測し、ツールチェーンにこれらの命令を発行させ、それらを逆アセンブルします

LSX と LASX のオペコードは 1 ビットずつ変化することがあります。命令は、128 ビットまたは 256 ビットのベクトル次元を対象としています。 しかし、それは普遍的な教育ではありません。 場合によっては、オペコードの下にある今日の一対のビットが情報形式を指定しているように見えます。 Loongson は、これらのバリエーションを LASX および LSX 命令プット拡張に組み込みました。 特に、Loongarch unruffled は、単一の命令で汚染、インデックス、およびスケールを追加で指定する可能性があることを示していません。 すべての x86 と ARM は、おそらく追加でそれを実行する可能性があることを示しており、より少ない命令で配列アクセスを廃止することができます. . 命令プットを完全に分析するつもりはもうありませんが、以下にいくつかの奇妙さの例を示します.

部分的なレジスタエントリ

まず、128 ビットの LSX 数学命令が 256 ビットの LASX レジスタ全体にマップされます。 すべての VFADD.S (パックされた FP32 部分を 128 ビット VR レジスタに追加する) および VADD.W (パックされた 32 ビット整数を 128 ビット ベクトル レジスタに追加する) は、 256 ビット レジスタのほとんどの場合、128 ビットの数学命令 (VFADD) は、オペコードが異なるという事実にもかかわらず、256 ビットの同一 (XVFADD) と同じように動作します。 x86 の動作とは異なり、256 ビットのベクトルに 128 ビットの演算を配置すると、上半分がそのまま残ります。

回想から部分的なレジスタ エイリアスにロードすると、さらに面白くなります。 それ以外の場合は常に、スカラー FP ロードによって 128 ビット レジスタの余分なビットがゼロになるという事実にもかかわらず、x86 は上位半分を保持したままにします。 Loongson では、レジスターの緩和に何が起こるかは、定義されておらず、合理的に予測できないように見えます。

Loongson の Loongarch リファレンス マニュアルには、64 ビット FP レジスタの過剰な 32 ビットは、FLD.S を使用した後に未定義になると書かれています。 FLD.S は、回想から FP32 コストをまとめて、ターゲット レジスタの最初の 32 ビットに配置します。 ビットの緩和は定義されていませんが、通常、次の 32 ビットには、回想からの次の 32 ビット コストが割り当てられます。 つまり、reminiscence サブシステムは 64 ビットの粒度でアクセスをネイティブに処理し、それより小さくすることは意図されていません

。

256 ビットをベクトル レジスタにロードし、部分的なエントリを取得し、合計 256 ビット レジスタのコストを記憶する

最初の 64 ビットより上で発生することは、完全にランダムであるように見えます。 パーツがゼロになることもあり、急速にガベージになることもあり、FLD.S 命令が急速に 256 ビット ロードとして機能することもあります。

FLD.S ロードを 16 KB ページの中断と同じくらい押し込むと、余分なものをロードするとページ境界が台無しになるため、ビット 32 から 63 も非常に予測不可能であることが判明します。 . 間違いなく、最新の結果はどちらもゼロであるか、キャッシュ ラインの先頭からロードされています。 時々、追加のアスペクトもロードされます。

256 ビットのレジスタを所有している場合、3A5000 は同様に奇妙な動作を示します。 VLD (128 ビット ベクター ロード) 付きの前半を 1 つずつ所有します。 着実に、VLD 命令は XVLD を称賛するように動作し、256 ビットをベクトル レジスタ全体にまとめます。 上位 128 ビットがページ境界をまたいでいる場合、結果は非常にランダムになります。

ここでのポイントは、Loongson の 3A5000 が、レジスターが 128 ビットまたは 256 ビットのコストを保持しているかどうかをヤーンに取り込むことです。 その場合、ベクトル レジスタの下位ビットを操作すると、上位ビットに予測できない影響が生じます。 Loongson は、レジスタのサブセットに対する操作の後、ベクトル レジスタの上位ビットが未定義であると考えているに違いありません。 理論的には、これにより効率が大幅に向上するか、廃止が簡素化されます。 一部の x86 CPU では、ベクトル レジスタの減少半分で作業しているときに、ベクトル レジスタの余分なビットを保持することに関連するペナルティが発生する可能性があります。 お知らせしますが、Sandy Bridge は、AVX YMM レジスタの上半分を宣言するように設計された「保存された啓発」との間で遷移するときに、70 サイクルのペナルティを被る可能性があります。

3A5000での初期構造寸法測定

そしてまたもや、ロンソンがクリアペナルティーを食らう。 スカラー フローティング レベル操作がベクター操作の前にある場合、FP/ベクターの名前変更スキルは約 32 エントリ減少します。 レジスタがすべての異なるものにエイリアス化されていると仮定しても (F0-F31 は XR0-XR31 と同じアーキテクチャ レジスタを参照)、コアが一度に 1 つずつ格納する必要があることに感心しているように見えます。 Sandy Bridge はさらに悪化しており、スカラー演算とベクトル演算を混在させると、FP の名前変更スキルが大幅に低下します。 Skylake を称賛する最近の CPU の多くは、並べ替えスキルに影響を与えていません。より強くするため、ここではその FPU とベクトルの実装を見ていきます。 3A5000 にはツイン ポート FPU があり、256 ビット実行用にネイティブ メイクが強化されています。 すべての実行ユニットとレジスタは 256 ビットです。 実行ユニットにフィードするために、L1D はサイクルごとに 2 つの 256 ビット アクセスをアドレス指定できます。 それぞれが公正であり、大衆でもあり、公正であり、店でもあります。 Zen 1 とは異なり、256 ビットの命令を 2 つの 128 ビットのマイクロオペレーションに分割することはありません

。

ベクトル整数と常識的な操作は、すべてのパイプを使用できます。簡単な操作は提供され、ビットごとの操作は単一サイクルのレイテンシーを果たします。 より洗練された演算は、順列または整数の乗算を賞賛し、3 ~ 4 サイクルかかります。これは、比較的最初の支払いです。 浮動レベル操作の場合、ベクトル単位はあまり満足できません。 FP は、実際に理想的なパイプを提供し、増殖させ、Sandy Bridge や古い設計との類似点を作成します。 Loongson は独自の FMA メイクを強化していますが、すべてのパイプが 1 つの FMA ユニットを構成しています。 そのセットアップにより、FMA 操作は、FP の追加または FP の乗算と並行して苦悩することができます。 しかし、繰り返しになりますが、FP 加算、FP 乗算、および FMA 命令の最適な組み合わせは、2 IPC に合理的に到達しません。これは、おそらく、最適ではないパイプ割り当てと、共有 FMA ユニットの競合が原因であると考えられます

浮動レベルの実行ユニットは、整数のものよりも大きく、余分な活力を必要とする傾向があります。 Loongson のアプローチは、256 ビットのベクトル次元の利点を最大の効率性を実現するために活用することに間違いなく興奮していました。 フローティング レベルのスループットは、機能が 256 ビットのベクトルを使用できると仮定すると、Zen 1 と一致します。 ただし、3A5000 は、1 サイクルあたり 2 つの 256 ビット FMA 命令を実行する可能性がある Skylake の影響を受けます。 Loongson はレイテンシーにも悩まされています。 ファッショナブル FP 操作は 5 サイクルのレイテンシで実行されます。これは、特に 2.5 GHz の低いクロック速度で有益であるため強力です。 比較のために、Zen 1 は FP 提供を実行でき、3 サイクルのレイテンシで乗算します。 Zen 1 独自の 5 サイクル レイテンシでの FMA 操作。

命令説明

3A5000 スループット/レイテンシ

パイプ?xvadd.d パックされた 64 ビット整数との 256 ビット ベクトル加算

1 サイクルあたり 2 1 サイクルのレイテンシ

毎回

xvmul.dパックされた 64 ビット整数との 256 ビット ベクトル乗算 2/サイクル
4サイクルレイテンシ
いちいち

xvxor.v
256 ビットのビット単位の見慣れない or

2/サイクル
1 サイクル レイテンシいちいちxvsll.h

256- bit vector shift

1サイクルあたり2
1サイクルのレイテンシ毎回

xvfadd.s パックされた FP32 パーツを使用した 256 ビットのベクトル加算
2 1 サイクルあたり
5 サイクル レイテンシ FADDパイプ

xvfmul.s

パックされた FP32 パーツを使用した 256 ビット ベクトル乗算 2/サイクル

5 サイクル レイテンシ )FMULパイプ

xvfmadd.d

パックされた FP64 パーツを使用した 256 ビット ベクトル融合乗加算 1サイクルあたり1

5 サイクル レイテンシ それぞれの、ただし最も効率的な 1 つの実行ユニット

xvpermi.d

256 ビット順列、インスタントで管理 2/サイクル 3サイクルレイテンシ

いちいち

)

この真実の結果、ロンソンは現れないベクトル実行ユニットで特に過度に狙いを定めているかのように。 Zen 1 には 128 ビットの実行ユニットがあるという事実にもかかわらず、3A5000 は Zen 1 よりもサイクルごとに余分なベクトル演算をプッシュすることはありません。 そのフローティング レベルの側面は、Intel および AMD の 2017 時代のテクノロジとは対照的に、過度のレイテンシと低いスループットを備えているため、あまり頑丈ではありません。 Intel と AMD が余分なポートと余分なスループットを自由に持ち運ぶことができるという事実にもかかわらず、非 FP 実行はより高くなります。エントリ FP スケジューラと 96 個のベクトル レジスタが手元にあり、名前を変更できます (上記の注意事項があるにもかかわらず)。 32 個の非投機的レジスターを追加すると、128 個のベクトル レジスター全体を調べることができます。 これらのレジスタは 256 ビットであり、ベクトル RF スキル全体で 4 KB を提供します。 Zen 1 は、統合された 36 エントリの FP スケジューラを使用し、その前に 64 エントリの非スケジューリング キューがあります。 したがって、AMD は、256 ビットの命令を 2 つのマイクロオペレーションに分割する必要がある場合でも、実行待ちの強力な追加オペレーションを検出できます。 Loongson は、レジスタ ファイル スキルで優位に立つことができます。なぜなら、最も効率的な AMD には 128 ビットの巨大なレジスタ (およびそれら全体で 160) があるからです。 しかし、その利点は、機能が 256 ビットのベクトルのロードを消費する場合に最も効率的であることを確認します。

実行ユニットの式とリソースのスケジューリングによって、3A5000 の FPU は過度の効率と低活力の実装の間のどこかに到達します。 それはもはや Zen 1 に匹敵するものではなく、Skylake に匹敵するものではありません。 Loongson の 256 ビットのベクトル幅と統合されたスケジューラーは、Ampere Altra よりも優れているはずですが、libx264 をチェックアウトしたところ、実際にはそうではありませんでした。 3A5000 は、Intel の以前の Goldmont Plus ベースのほぼ完全な Celeron J4125 を、同じビデオ エンコーディングで説得力を持って打ち負かしています。 それから、3A5000 よりも壮大な活力低下ターゲットのゴールドモント プラスの目標をもう一度、ゴールドモント プラスには AVX または FMA の指示がありません。

最終フレーズ

互換性のないエンコーディングを利用することで、Loongson は最新の ISA があることを知らせ、MIPS とは別にそれを作成することができます。 Loongarch と MIPS は、MIPS64 マニュアルを追加で費やす可能性があるレベルまでセマンティクスのかなりの山を構成しますが、MIPS の能力を理解して Loongarch と呼んでも、ISA の権利に対処することを好みません。 この形式はかなり理にかなっています。 セマンティクス機能を維持することで、Loongson は多くのツールチェーンをすばやく再利用できます。 最新の ISA のエンコーディング機能を変更し、ライセンスの制限に縛られていません。

AVX と SVE と並んで、Loongson の LASX は 128 ビットを超えるベクトル次元を取るもう 1 つの ISA 拡張機能です。 . さらに重要なことに、Loongson は、国内の CPU 能力を構築するための中国の取り組みの段階です。 LASX は、中国が過度の効率化を目指していることを示唆しています。なぜなら、128 ビットのベクトル実行は、活力の低い機能には十分であり、過度の効率化はもはや問題ではないからです.

しかし、Loongson 3A5000 の LASX 実装は決してAMD および Intel のデスクトップ CPU に相当する AVX2 の実装には、もはや積極的ではありません。 Skylake と Zen 1 はそれぞれ独自のより広いベクトル実行セットアップを備えており、レイテンシを吸収するために追加の操作を実行する可能性があります。 3A5000 の低クロックは、リモートで新しいデスクトップ CPU に完全に勝っていることを確認して、棺桶に大きな爪を置きます. 確かに、過剰なクロック速度で 256 ビットのベクトル実行ユニットを動作させることは、もはや簡単なことではありません。 しかし、AMD と Intel 自身が、それを差し控える有益なスキームを発見しました。

もしあなたが私たちの記事やジャーナリズムを賞賛し、私たちの努力で私たちをより強くしたいのであれば、私たちの

  • Patreon
  • または当社の ペイパルあなたは私たちの式または暴露で一対のドルを投げることを所有することができます. 不和。

  • clamchowder

  • 𝚆𝚊𝚝𝚌𝚑 𝙽𝙾𝚆 📺

    anti-Mastodon, Ask HN, Auto-Generate, Billionaires, Blockchain, coding, computer science, CRYPTO, Loongson’s, Show HN, Technology, TOP HN, Vector Tags:Blockchain, Loongson’s, Vector

    Post navigation

    Previous Post: Relic: Clojure(Script) 向けの合理的なリレーショナル プログラミング
    Next Post: Scummvm 2.70

    Related Posts

    • CrystalEyes Stereographics (無音宣伝??)
      CrystalEyes Stereographics (無音宣伝??) anti-Mastodon
    • 月曜日の口頭弁論で半分を使用するための許容される手法: Web アーカイブ
      月曜日の口頭弁論で半分を使用するための許容される手法: Web アーカイブ anti-Mastodon
    • AIと労働者を交換するべきですか? 再訓練費を探す
      AIと労働者を交換するべきですか? 再訓練費を探す anti-Mastodon
    • Biochar: 'The Wild, Wild West'
      Biochar: 'The Wild, Wild West' “the
    • カーOSはその約束を果たします
      カーOSはその約束を果たします anti-Mastodon
    • フィンテック: Web3 を使用して収益を上げ、特定の人物の成果を上げます
      フィンテック: Web3 を使用して収益を上げ、特定の人物の成果を上げます anti-Mastodon
    • ほとんどの専門家は、Elon が Twitter の Exigous の性的虐待をさらに悪化させたことに同意しています。
      ほとんどの専門家は、Elon が Twitter の Exigous の性的虐待をさらに悪化させたことに同意しています。 Agree
    • AI と物理学の交差点を探る: Code Gen における ChatGPT の役割
      AI と物理学の交差点を探る: Code Gen における ChatGPT の役割 anti-Mastodon
    • R/AmITheAsshole の心理社会的な素晴らしい点
      R/AmITheAsshole の心理社会的な素晴らしい点 anti-Mastodon
    • Elkhart Lake Mini-PC は、3 ポート 2.5GbE と WiFi6E および BT5.2 接続を統合
      Elkhart Lake Mini-PC は、3 ポート 2.5GbE と WiFi6E および BT5.2 接続を統合 anti-Mastodon

    Recent Posts

    • Webフィンガープリンティングは私が思っていたよりも悪い
    • 幕の内:燃料と核のロビーがEUの分類法を再形成するとき
    • OpenAI は、自分自身であることを拒否した後、その決定のために荒らされています
    • ヤマハ NS10 エピック (2008)
    • Awesome-completely-open-ChatGPT: ChatGPT のオープン ピックのリスト

    Recent Comments

    1. robga on Excessive Avenue コーヒーのカフェイン ステージはさまざまで、テストでは
    2. Loic on 行方不明の放射性タブレットは、必死の捜索の後、WA奥地で偶然見つけました
    3. minihat on メタは、標準的な VR e スポーツ Echo Area をシャットダウンします
    4. dafelst on フレーム ポインターの巻き戻しによる Move 実行トレーサーのオーバーヘッドの削減
    5. cloudking on GraphGPT: 構造化されていないテキストの肯定的な素材からのレコードデータ グラフの外挿
    • フィンランドがF-35Aを選んだ理由 (2021)
      フィンランドがF-35Aを選んだ理由 (2021) Artificial intelligence
    • FTC、イーロン・マスクによる Twitter Blue と Twitter ファイルの取り扱いを調査中
      FTC、イーロン・マスクによる Twitter Blue と Twitter ファイルの取り扱いを調査中 anti-Mastodon
    • Elixirによるダイナミックイメージ時代
      Elixirによるダイナミックイメージ時代 anti-Mastodon
    • 私はMMAを受け入れました。 しかし、平手打ちの苦労: 私たちはここで何をしているのか?
      私はMMAを受け入れました。 しかし、平手打ちの苦労: 私たちはここで何をしているのか? anti-Mastodon
    • XYZ Affair and the Quasi-Battle with France, 1798–1800
      XYZ Affair and the Quasi-Battle with France, 1798–1800 NASA
    • 2023-01-04T00:00:00Z iss068e036934
      2023-01-04T00:00:00Z iss068e036934 𝙱𝚒𝚘 𝙴𝚡𝚙𝚎𝚛𝚒𝚖𝚎𝚗𝚝𝚜™
    • 自動決定 ChatGPT 過去の履歴
      自動決定 ChatGPT 過去の履歴 anti-Mastodon
    • Apple も修理できなかったし、AT&T も修理できなかった。  iPhone IMEIの苦痛への降下
      Apple も修理できなかったし、AT&T も修理できなかった。 iPhone IMEIの苦痛への降下 anti-Mastodon
    MAILANON
    2100 MAIL
    SEO
    METAVERSE
    BioLINK
    CRYPTO MINING
    CASINO
    DEFI-TRACKER
    StartApp Network
    RAVES-MONSTER-GAME
    RAVES EXCHANGE
    RAVES NFT
    KVANTA TV

    Copyright © 2023 Nasare™🚀.

    Powered by PressBook News Dark theme