URL
https://opencores.org/ocsvn/raytrac/raytrac/trunk
Subversion Repositories raytrac
[/] [raytrac/] [branches/] [fp/] [dpc.vhd] - Rev 201
Go to most recent revision | Compare with Previous | Blame | View Log
--! @file dpc.vhd --! @brief Decodificador de operacion. --! @author Julián Andrés Guarín Reyes -------------------------------------------------------------- -- RAYTRAC -- Author Julian Andres Guarin -- dpc.vhd -- This file is part of raytrac. -- -- raytrac is free software: you can redistribute it and/or modify -- it under the terms of the GNU General Public License as published by -- the Free Software Foundation, either version 3 of the License, or -- (at your option) any later version. -- -- raytrac is distributed in the hope that it will be useful, -- but WITHOUT ANY WARRANTY; without even the implied warranty of -- MERCHANTABILITY or FITNESS FOR A PARTICULAR PURPOSE. See the -- GNU General Public License for more details. -- -- You should have received a copy of the GNU General Public License -- along with raytrac. If not, see <http://www.gnu.org/licenses/>. library ieee; use ieee.std_logic_1164.all; use work.arithpack.all; entity dpc is port ( clk,rst : in std_logic; paraminput : in vectorblock12; --! Vectores A,B,C,D prd32blko : in vectorblock06; --! Salidas de los 6 multiplicadores. add32blko : in vectorblock04; --! Salidas de los 4 sumadores. sqr32blko,inv32blko : in std_logic_vector (floatwidth-1 downto 0); --! Salidas de la raiz cuadradas y el inversor. fifo32x23_q : in std_logic_vector (03*floatwidth-1 downto 0); --! Salida de la cola intermedia. fifo32x09_q : in std_logic_vector (02*floatwidth-1 downto 0); --! Salida de las colas de producto punto. unary,crossprod,addsub : in std_logic; --! Bit con el identificador del bloque AB vs CD e identificador del sub bloque (A/B) o (C/D). sync_chain_0 : in std_logic; --! Señal de dato valido que se va por toda la cadena de sincronizacion. eoi_int : in std_logic; --! Señal de interrupción de final de instrucción. eoi_demuxed_int : out std_logic_vector (3 downto 0); --! Señal de interrupción de final de instrucción pero esta vez va asociada a la instruccón UCA. sqr32blki,inv32blki : out std_logic_vector (floatwidth-1 downto 0); --! Salidas de las 2 raices cuadradas y los 2 inversores. fifo32x26_d : out std_logic_vector (03*floatwidth-1 downto 0); --! Entrada a la cola intermedia para la normalización. fifo32x09_d : out std_logic_vector (02*floatwidth-1 downto 0); --! Entrada a las colas intermedias del producto punto. prd32blki : out vectorblock12; --! Entrada de los 12 factores en el bloque de multiplicación respectivamente. add32blki : out vectorblock08; --! Entrada de los 8 sumandos del bloque de 4 sumadores. resw : out std_logic_vector (4 downto 0); --! Salidas de escritura y lectura en las colas de resultados. fifo32x09_w : out std_logic; fifo32x23_w,fifo32x09_r : out std_logic; fifo32x23_r : out std_logic; resf_vector : in std_logic_vector (3 downto 0); --! Entradas de la señal de full de las colas de resultados. resf_event : out std_logic; --! Salida decodificada que indica que la cola de resultados de la operación que está en curso. resultoutput : out vectorblock08 --! 8 salidas de resultados, pues lo máximo que podrá calcularse por cada clock son 2 vectores. ); end entity; architecture dpc_arch of dpc is constant qz : integer := 00;constant qy : integer := 01;constant qx : integer := 02; constant az : integer := 00;constant ay : integer := 01;constant ax : integer := 02;constant bz : integer := 03;constant by : integer := 04;constant bx : integer := 05; constant cz : integer := 06;constant cy : integer := 07;constant cx : integer := 08;constant dz : integer := 09;constant dy : integer := 10;constant dx : integer := 11; constant f0 : integer := 00;constant f1 : integer := 01;constant f2 : integer := 02;constant f3 : integer := 03;constant f4 : integer := 04;constant f5 : integer := 05; constant f6 : integer := 06;constant f7 : integer := 07;constant f8 : integer := 08;constant f9 : integer := 09;constant f10: integer := 10;constant f11: integer := 11; constant s0 : integer := 00;constant s1 : integer := 01;constant s2 : integer := 02;constant s3 : integer := 03;constant s4 : integer := 04;constant s5 : integer := 05; constant s6 : integer := 06;constant s7 : integer := 07; constant a0 : integer := 00;constant a1 : integer := 01;constant a2 : integer := 02;constant aa : integer := 03; constant p0 : integer := 00;constant p1 : integer := 01;constant p2 : integer := 02;constant p3 : integer := 03;constant p4 : integer := 04;constant p5 : integer := 05; constant dpfifoab : integer := 00; constant dpfifocd : integer := 01; signal sparaminput : vectorblock12; --!TBXSTART:FACTORS_N_ADDENDS signal sfactor : vectorblock12; signal ssumando : vectorblock08; signal sdpfifo_q : vectorblock02; --!TBXEND --!TBXSTART:ARITHMETIC_RESULTS signal sresult : vectorblock08; signal sprd32blk : vectorblock06; signal sadd32blk : vectorblock04; signal ssqr32blk,sinv32blk : xfloat32; signal snormfifo_q,snormfifo_d : vectorblock03; --!TBXEND --!TBXSTART:SYNC_CHAIN signal ssync_chain : std_logic_vector(25 downto 1); signal sres567w,sres123w,sres2w : std_logic; signal sres0w,sres4w : std_logic; --!TBXEND --! Entradas de la señal de full de las colas de resultados. signal sres567f,sres123f : std_logic; signal sres24f,sres0f : std_logic; begin --! Cadena de sincronización: 29 posiciones. sync_chain_proc: process(clk,rst,sync_chain_0) begin if rst=rstMasterValue then ssync_chain(25 downto 1) <= (others => '0'); elsif clk'event and clk='1' then for i in 25 downto 2 loop ssync_chain(i) <= ssync_chain(i-1); end loop; ssync_chain(1) <= sync_chain_0; end if; end process sync_chain_proc; --! Escritura en las colas de resultados y escritura/lectura en las colas intermedias mediante cadena de resultados. fifo32x09_w <= ssync_chain(5); fifo32x23_w <= ssync_chain(1); fifo32x09_r <= ssync_chain(12); fifo32x23_r <= ssync_chain(21); resw <= sres567w&sres4w&sres123w&sres2w&sres0w; sync_chain_comb: process (ssync_chain,addsub,crossprod,unary) begin if unary='1' then --!Desconectar los canales de Suma, Resta, Producto Punto y Producto Cruz sres123w <= '0'; sres2w <= '0'; sres4w <= '0'; --! Producto Escalar, Normalización o Magnitud sres567w <= crossprod and ((ssync_chain(4) and addsub) or (ssync_chain(24) and not(addsub))); sres0w <= ssync_chain(19) and not(addsub) and not(crossprod); elsif addsub='1' then --! Desconectar los canales de Normalización, Producto Escalar, Producto Punto C.D y Magnitud sres567w <= '0'; sres0w <= '0'; sres4w <= '0'; --! Suma o Resta. sres123w <= ssync_chain(7); sres2w <= ssync_chain(7); else --! Desconectar la escritura en los canales de Normalización, Producto Escalar, Suma, Resta y Magnitud. sres567w <= '0'; sres0w <= '0'; --! Producto Punto o Cruz. sres2w <= (ssync_chain(18) and not(crossprod)) or (ssync_chain(11) and crossprod); sres4w <= ssync_chain(17) and not(crossprod); sres123w <= ssync_chain(11) and crossprod; end if; end process sync_chain_comb; --! El siguiente código sirve para conectar arreglos a señales std_logic_1164, simplemente son abstracciones a nivel de código y no representará cambios en la síntesis. sparaminput <= paraminput; prd32blki <= sfactor; add32blki <= ssumando; resultoutput<= sresult; stuff04: for i in aa downto a1 generate sadd32blk(i) <= add32blko(i); end generate stuff04; stuff03: for i in 02 downto 0 generate snormfifo_q(i) <= fifo32x23_q(i*floatwidth+floatwidth-1 downto i*floatwidth); fifo32x26_d(i*floatwidth+floatwidth-1 downto i*floatwidth) <= snormfifo_d(i); end generate stuff03; stuff02: for i in 01 downto 0 generate sdpfifo_q(i) <= fifo32x09_q(i*floatwidth+floatwidth-1 downto i*floatwidth); end generate stuff02; --! El siguiente código sirve para conectar arreglos a señales std_logic_1164, son abstracciones de código también, sin embargo se realizan a través de registros. register_products_outputs: process (clk) begin if clk'event and clk='1' then sprd32blk <= prd32blko; end if; end process; --! Los productos del multiplicador 2 y 3, ya registrados dentro de dpc van a la cola intermedia del producto punto (fifo32x09_d) --! Los unicos resultados de sumandos que de nuevo entran al DataPathControl (observar la pestaña del documento de excel) fifo32x09_d <= sprd32blk(p3)&sprd32blk(p2); register_adder0_and_inversor_output: process (clk) begin if clk'event and clk='1' then sadd32blk(a0) <= add32blko(a0); sinv32blk <= inv32blko; end if; end process; --! Raiz Cuadrada. ssqr32blk <= sqr32blko; --! Colas de salida de los distintos resultados; sresult(0) <= ssqr32blk; sresult(1) <= add32blko(a0); sresult(2) <= sadd32blk(a1); sresult(3) <= sadd32blk(a2); sresult(4) <= sadd32blk(aa); sresult(5) <= prd32blko(p3); sresult(6) <= prd32blko(p4); sresult(7) <= prd32blko(p5); --! Cola de normalizacion snormfifo_d(qx) <= sparaminput(ax); snormfifo_d(qy) <= sparaminput(ay); snormfifo_d(qz) <= sparaminput(az); --! La entrada al inversor SIEMPRE viene con la salida de la raiz cuadrada inv32blki <= ssqr32blk; --! La entrada de la raíz cuadrada SIEMPRE viene con la salida del sumador 1. sqr32blki <= sadd32blk(a1); --! Conectar las entradas del sumador a, a la salida ssumando(s6) <= sadd32blk(a2); ssumando(s7) <= sdpfifo_q(dpfifocd); --!El siguiente proceso conecta la señal de cola "casi llena", de la cola que corresponde al resultado de la operación indicada por los bit UCA (Unary, Crossprod, Addsub). --!Adicionalmente codifca en formato one HOT la cola de la instruccion en la que se escriben los resultados de la ultima instrucción que haya finalizado. sres0f <= resf_vector(0); sres123f <= resf_vector(1); sres24f <= resf_vector(2); sres567f <= resf_vector(3); fullQ:process(sres0f,sres123f,sres24f,sres567f,unary,crossprod,addsub,eoi_int) begin if unary='0' then if addsub='1' or crossprod='1' then --! Suma o Resta o producto cruz, comparten la misma cola de resultados. eoi_demuxed_int <= "00"&eoi_int&'0'; resf_event <= sres123f; else --! Producto Punto utiliza como salida las colas 2 y 4 eoi_demuxed_int <= '0'&eoi_int&"00"; resf_event <= sres24f; end if; elsif crossprod='1' then --! Normalización o Producto Escalar eoi_demuxed_int <= eoi_int&"000"; resf_event <= sres567f; elsif addsub='0' then --! Magnitud eoi_demuxed_int <= "000"&eoi_int; resf_event <= sres0f; else --! Se debería generar una excepción de señal invalida. eoi_demuxed_int <= x"F"; resf_event <= '0'; end if; end process; --! Decodificación del Datapath. mul:process(unary,addsub,crossprod,sparaminput,sinv32blk,sprd32blk,sadd32blk,sdpfifo_q,snormfifo_q) begin sfactor(f4) <= sparaminput(az); if unary='1' then --! Magnitud y normalizacion sfactor(f0) <= sparaminput(ax); sfactor(f1) <= sparaminput(ax); sfactor(f2) <= sparaminput(ay); sfactor(f3) <= sparaminput(ay); sfactor(f5) <= sparaminput(az); --!Multiplicación escalar. if crossprod='1' and addsub='1' then sfactor(f6) <= sparaminput(cx); sfactor(f7) <= sparaminput(dx); sfactor(f8) <= sparaminput(cy); sfactor(f9) <= sparaminput(dx); sfactor(f10) <= sparaminput(cz); sfactor(f11) <= sparaminput(dx); else sfactor(f6) <= snormfifo_q(ax); sfactor(f7) <= sinv32blk; sfactor(f8) <= snormfifo_q(ay); sfactor(f9) <= sinv32blk; sfactor(f10) <= snormfifo_q(az); sfactor(f11) <= sinv32blk; end if; elsif addsub='0' then --! Solo productos punto o cruz if crossprod='1' then sfactor(f0) <= sparaminput(ay); sfactor(f1) <= sparaminput(bz); sfactor(f2) <= sparaminput(az); sfactor(f3) <= sparaminput(by); sfactor(f5) <= sparaminput(bx); sfactor(f6) <= sparaminput(ax); sfactor(f7) <= sparaminput(bz); sfactor(f8) <= sparaminput(ax); sfactor(f9) <= sparaminput(by); sfactor(f10) <= sparaminput(ay); sfactor(f11) <= sparaminput(bx); else sfactor(f0) <= sparaminput(ax) ; sfactor(f1) <= sparaminput(bx) ; sfactor(f2) <= sparaminput(ay) ; sfactor(f3) <= sparaminput(by) ; sfactor(f5) <= sparaminput(bz) ; sfactor(f6) <= sparaminput(cx) ; sfactor(f7) <= sparaminput(dx) ; sfactor(f8) <= sparaminput(cy) ; sfactor(f9) <= sparaminput(dy) ; sfactor(f10) <= sparaminput(cz) ; sfactor(f11) <= sparaminput(dz) ; end if; else sfactor(f0) <= sparaminput(ax) ; sfactor(f1) <= sparaminput(bx) ; sfactor(f2) <= sparaminput(ay) ; sfactor(f3) <= sparaminput(by) ; sfactor(f5) <= sparaminput(bz) ; sfactor(f6) <= sparaminput(cx) ; sfactor(f7) <= sparaminput(dx) ; sfactor(f8) <= sparaminput(cy) ; sfactor(f9) <= sparaminput(dx) ; sfactor(f10) <= sparaminput(cz) ; sfactor(f11) <= sparaminput(dx) ; end if; if addsub='1' then ssumando(s0) <= sparaminput(ax); ssumando(s1) <= sparaminput(bx); ssumando(s2) <= sparaminput(ay); ssumando(s3) <= sparaminput(by); ssumando(s4) <= sparaminput(az); ssumando(s5) <= sparaminput(bz); else ssumando(s0) <= sprd32blk(p0); ssumando(s1) <= sprd32blk(p1); if crossprod='0' then ssumando(s2) <= sadd32blk(a0); ssumando(s3) <= sdpfifo_q(dpfifoab); elsif unary='0' then ssumando(s2) <= sprd32blk(p2); ssumando(s3) <= sprd32blk(p3); else ssumando(s2) <= sadd32blk(a0); ssumando(s3) <= sdpfifo_q(dpfifoab); end if; ssumando(s4) <= sprd32blk(p4); ssumando(s5) <= sprd32blk(p5); end if; end process; end architecture;
Go to most recent revision | Compare with Previous | Blame | View Log