From 1e0b785a795d7b84ebcd7700f9a9af907c223b5c Mon Sep 17 00:00:00 2001
From: sushant khemalapure <sushantkhemalapure@gmail.com>
Date: Wed, 8 Apr 2026 21:59:50 +0530
Subject: [PATCH 1/2] resolve Streamlit model paths relative to app directory

---
 .../__pycache__/app_streamlit.cpython-39.pyc  | Bin 0 -> 20331 bytes
 .../code/app/app_streamlit.py                 |  54 ++++++++++++++----
 2 files changed, 43 insertions(+), 11 deletions(-)
 create mode 100644 RenAIssance_Transformer_OCR_Utsav_Rai/code/app/__pycache__/app_streamlit.cpython-39.pyc
diff --git a/RenAIssance_Transformer_OCR_Utsav_Rai/code/app/__pycache__/app_streamlit.cpython-39.pyc b/RenAIssance_Transformer_OCR_Utsav_Rai/code/app/__pycache__/app_streamlit.cpython-39.pyc
new file mode 100644
index 0000000000000000000000000000000000000000..d3d8648c7b6760b2f584c92001dd762c80a3a3da
GIT binary patch
literal 20331
zcmb_^dvGMjdEdNt_JQ36uvk2KJgrEIBq$R15MMf-c)SOWchVgW1i+&>JaV<SJpdNi
z7kUObU^Qzq!qJwMoOx0lRV;}Kz^X)M;yAWqE4Jg<s!Ao5hn-is6niR_*h)pJOY(;+
zaaCN56z2DRJ-b-oPP9^GY)wzUyQjOq_tz+8GARvzYn$Jxm_Mm$|Ai90e^mNB9`9OG
z(}X7Us^+M-?&z+*V(ge4T5fDt-_;#EN>NGNwS^(fT@(2U*LD+&#yRb^M;(LfBwb@y
zm*-r=)mDrRis8MJ5*qRiU0XZHqxCs`{7%<0hNf$^tdrGge5=}D8*m0Vu2%=0LFC1%
zx!RC36y@ceJhvQnhWS0>jNoloM{8rwSZ&-HkLpc06I_0ubBN#fJNM%quO6;_$oWvM
z;1r^IA9fx<exmwd?IGtOU2`8;`G`o0)GZz5eIk8Ra~>8Mk;VHFlszi?#lTH%TX!af
zE(X7@i<}s`X*iE@SzZit*+<=vZfn;}=W*u=XUaXaa>PCA9;3Gy`MM=W#n?^DInMc%
zH~w`)Oo;oC_c6|U(tVQa9zxyw#bM+>wXg1nL;-nEiw}zjFso<8Pl<=cBR6&DS@F~2
zG4WBvJ}$l>o)A-roe)RFQPlbb=66yY6UTXepA<hMo)k}^{5kQocn0OC#Ixe#ct0;r
zh)>{sTAXywh)+6a#dBzRZbQFq$m11Sopa*3lbSfy&AlL==iF1sJ>AWH9s5mnPb2qC
zH@Bto##PxFl%4IC-4;5Ro;^vW(>v$Ixn1l5#aCVs)8hP+E?&50I2WSQ3*FL-;-dJJ
z__VkrE{mC4G3Qg<=AyWQeZ3?ejB-C6<<27aMKKrUUgF%#VqQEi7SQ`llzu5nUy0IJ
zqx5W)emP3N=)Q=YbK=yvwrbusrQp<a<J!*LF3xqQ6yNkBO8+gj#+QAjXYQ|HK8|=O
zn$JA<e^I>3xt%Xsh;pxq*Tn1MBcjOP`BIeoS<Wp*xmW80;vr{VTyhq~N1T^L$+;Sh
zdYwiUWu(q+Xt!hXA<ln!NfY87z&Ot9XPj3Y$NkJ(&#QIcc~!W(`fUp^%zHTw2wk=I
z(lHG=m!H*4?WFcHaEPT@+P0}{_1rP-w&giTu>$ma1&{m6TNk3;ye1aKW$v*YorKfW
z&nO=LuGet>U)$Ej<+1J=x<~K7zOQ%Ztxt95yo5Q&q|upkXC&%xmA*SFQL}&M-m{N+
zW4-;?)97V-=XJ5nYgiF0fRUnD6;-@H>s}E0x_&z;XGD!g1GL1vWghn|zVO0I31=fF
zzuP+Dj;vgFFYJ_eHE~|lZ>gEoa5_*&)u+?HBSeF8zNWnmT&iPj>(5!5>)wuS{gJLY
zi@Mgr-t8=jrn}gwgY+_;xR<foLU$HlU96|n`>1wQ6Km1DY?*b7JW>ra`_#6Y!5Sb@
zt+kAx?}JZ;hZVM^!~MwURCLoHcq(kK*}Ja$PK6(xinZueP|tg(qJmRV={Xgc>0PJ7
z_Wt$0-g{5QI_4agW1Ttk8zV)hqFeHTry}l6?d$)u-IXNxz<jZy<~74vaaP?GJ`-`d
z=&tNkceT2K-Ke>>DEA$A_IBKR$Gw6%eZl>hTLVR@xid(8#eF(TJ>}NiPrH}4O{cb`
zIrVPa5V#~RL-!QQ=iLSOCHJb>=zQ1LG;!l?bKAx&YTY&oocV@ZTWMnbHdl??l%CjG
zL;Hypxr>@n-wF9J`lhhX;m1*<E*=$Iw*b{RVV-EYs~Dm6HfTR`)Yl~C8I-*&HpS<b
za9%O8@2tE2TaPhBZgfYwv1_=iA`orr?XJB`cwgMNw(D<wB^vW5c&rCjUKKwn-q`!j
zw+-=^fU!5-O+elVX0RnbzpKCXBwC%OnYr~PZQF8MZVTMWfb%)j2;9$6U$+x$-@R-6
zq?hU)zn((<*TuGizXP}}={<c{-9X%=x>36~DK7MRZSsqEi0_(t&zPDDV`t}1pI?~N
z!@et^6w(#vDrJ9CmnLdV8e!~Wt+eEZX?{)DmrM1si|p)zymEGKRyNA6=QU(FezoFN
z8ujUVxq(j3x%|3}cojWoh3mVrR;jy1Z`HlwST`!dodg3{Ep0W{{jyH8iT*6S<9J@c
z<IN%PwH-ascJ;Oq7%~?a^ID)|@y6PwPfVN{VB6(LU=qtVudR*vmO%aH31Q$+n8MnL
z1t26qN!GUhd0n8+WNfB&|JlZRRTSzCzaU+&QQdG0r9!jhFBcXYve3#(cWu3b#VC|K
z&-Gi$sltM+xZ*^iWjtP(v_qreh4vCYtG*Fh)GoB$&5GxH;o$j7)tzbh=Ns#FF)bw)
z$69Gr>XVieNA2Q9Njj-=sV*v_<hx#&Xl%GrVnM=WH}_pl=J4t7otks&r!RUQEqZZ5
zmg*j6S94_%YhQfH_evYZxl-jCE%voivq?|U^QBv=RV)5fb1NK<KCZ}<tJIf@G}ptl
zwj&5MJ*8W^WhC^po-z!CiTADdWgaE_HpNB;J!kQF*AVzxfNj|Y&na~96@~ze$wR_y
z>vb%DTldXv4I8HISi2hW;n$3|*|vBy%pF@;yLy1Fc+(iCjg19XU<9#~+S(LtFSbY0
zi3sglL#$WbJDkv`CgY)1#S(|ss=MWdDbFuS-@8%qmn9vVFjn#1nkV}??lrLjleR;(
ze77iYrky0WC|1O#ldZcquu`3(P+tvoY-GKJ#if;3!4P$oDL0y1^Hh}p<8fqp0|+#I
zM7Iq~xAg&i49h4B$SYGp=Z{Wt8V@hpdx-b|KA*)HoKY55I2G&WVSzY5wySTOZOyl_
zh`Jx&N%--V<W6c=lNUq`NZV#;(0BU$G)gjo78oLa%h<*_*8v?n*?>tjV*NyZh1NDj
zqHP71{1Xx*sspvbc1)-F^mWHJM0(e}=X}z;YCd)l!+Zd5-Er-G<C@)ZO*L+yV_VHd
z6I+^@aSqK*&z!zEKYx1W>~xWFPVw@UbJLfKv!@p>IPn{9Wog;>T7zX-TJ(#xs$V?*
z)aq0dyK7+WLaV$kN}*Y9t^;wTYo%tf+9;QN;G6|MEkHBLId>5_X2$iM!*>rhH+}x%
z%=8=&*BV!&NNymDXBS>R_SDg%G}>g2kG~{gRMPgT0~J3#J6k+=aW0IPu6qPSj32|8
z-;ia%zHm1xWmkTfW}2>e#nMKpQY~Gtx=w$!0WNs&sPQ?$K}K$9_>ItVH%e6}sb*4l
zefc2zn2b9)UzYGOq6i>xs|>cGN#&2w7%5f1hz!S$zJeM$xy~o;H9L5q2Y5!&GE?Wz
zprLmZfo2-Ip=b4pA6jwS7&FI=l%6nwAn;40Br1#9eBu+joI)FriYM?Y$EXAR5iE}4
zN#Nn5|7E~0P&Glk?i(v69r0V%HM5;;r`mnO3R3r>Q9Iqv0M%PT5{EnM$9C)>yQ}ZS
zMNAOBFx%N6yOZFfPqAbWkLm#|-a3S1uLap{(D`<MdjND4Jw|;0z%kAHd@p4T`q3k5
zylF(Cy=Vc4_3dgq>0PZocvrc#uRIqdga*!9mycqWH2MTaPXztJz_!sIx@+wJyKn5F
z4;(w^X8=Tl0mxin0xR0P;F;R__Av7MgM5$)0Hp0ar-q}{us`4r2E*I>Hj%|bdn6bR
zMu`7i*D%Lrv_gvVP9nWV>ET7fvhkUUhCN%tHsSBjPEDFlpSQMNk|5HRmg{6Hbr9`l
zqsl<$B*6w0CB-FCjynXD3h;7ayi!|gf)#LvKyJ{sSn`@~*;my8vm3{q^u?J40N*8m
z;ORMMxDGN_s-o&;w^YAck`<zG@?rGpq!wkPR;;hrnp;l13ASO~cb(*V9dmQtmMb5l
zO7VK5xFkzLK7dph<Jw`LI@9ZZrRq6-AkODp|4d`k^_<a?SXuY{IoDgS`ez#rDJpd)
zzA?~La5rYvtxt|hLhc|V%<yD=chfHd&RuW0Q59jfTB)!0q!ZP~jUv@iKyP88wiq@U
z8k{~XNl~qaaMGYun2uTxC(TQ=?3R3BF(=MzT3qf#ZiM<~sN>TYQDI%WpkU<&_JoG&
z#Azx{atr+vzLR0>I(=mrqd9o;etgA2m`{My@CjSIibC%=0u8h)^?uq+n<+gH`jx`_
zF|(i-@J{KE;tiO8KM~6U9}LiA$Wv%lrly@g0{Je5`w9}ot0}Gwv??cb&?-<OP%=xH
zer(0wiTeovv%&FXHzx)lw|2o4fa>X}YX^F_?1O4sZNpFP^bxfKH<(5Y6mSRh5NV46
zNMq^~pW#j7!{Uthk_O_V6cqw)cZlI|s~!^^=l+BBX6LS)ot~e+GDmb^GRvn`?Kq)*
z`6va%IUOJ!@*&Fm2nECuIQ@LSn-Zv;5xgWs$)|cU#@#uoJ>2bN39gvMRwN+VO@}eA
zc5tV&jNKb$sR+lL=-eZIPcz0CgQxYeA6hZO<;3od{lKzQ*k5@DH6|_jG+tp0Fi~~G
z)b&z%bx9H%8-m8*FxJZ^^%VUPg`_WHB>z1`0&N9oN9e@XDTdG2cMRH-cFZ?@;>5v8
z1ZEy=Bd5VpAZ<~4RBPKkbvUo54!1#_xF1J92_A{ixA~??ETquyLm%yg4=xF)SjTAs
zc?pstMxt{N56m&l>po2>R*-LVz8zS-`F?Vx4`d_>t|}AQgitvar`RH-5AawP5NBdW
z9>LctH26OLzK<0C{^Zo8!I@l)IPtA2t~-6#fplDXwNzbqC$k|`F{P#(S~YMI1o;98
z&<joQ7NJpZI;K~tJ7yU&M$BJtVlQGPDN9@O7<zPufJ){XU`WCHTrT;tvU&WRle$ro
z&C`p74?+`|JB;zhO{REDCGC+sN3BypX2oS@wwxrzA&X%SY2I^SD4Iza<IK>G>ZKVa
z7RxSC1WdO9{tN>jV3cj-1F3!uqj*%L={aDMhxCVx!@wV7_{llsVqxf%$!P@pgbZRF
z=;8B3Rg~mM_+-~0ks`o8kQ7MdS5EmB^Sy*Kz>`8Mgk;CkoiX#Ssn(u1fC4}kEnS!>
zZvg#QA(Ca!UbzHFKJ&ud@fYS!zan9A(A4x45I9MYmo2Ycs=B;*{MGn6aqz3t!X=ru
z$V>DM^x_dl)bPa#{L&Dv<W;0Quyv^3sCX_gcdY@wuLx>e>LDsaM04w2#oyY?R14J$
zcqEq4e0iY`<NHV&TfyQ8ebtbUQ(OQ9Rmvw3Sp(k%MA|m%STvwY1E6REB^xU?o;bvg
z*sk5S{KO7G!%wWFP&bBJeSwAYG{DpZcv70`XE+^4EE~i{TqJH8*Q|Cz@pC~6A_nnR
zsYT48okpMiL2^Zpdd>I)A{ivM4e%-_z|$pz>?(LR)EWfB?q_*$AV>#UksKq?)mLNk
zTfsnJtm^Vx!UWIL4>|E$m`g6m0I>{W7DK@xtRnnFDi7Up`W;<lZpGWVAP0cW&fKBp
zV^F;FK4N!<DHun9!^p5q!5u=xBwUmm^*Y#>$_Dm90rYt)CVV$(N(ZmK;9Wh8VIu+5
z!}2LAxj+FOHn~8-O9-67k|;INpS#duC!CSf=T6TqT)aA6T(~edJ%6EidHVEB@vJi#
zCC^-(IX(AE@#4%?`Dt_!T8%nU_;nnRXTx-@A)DYz8cSQ#n_=qmmATmq#VfPZGhv^K
zpS^Tte%d({eTXa0Hfl|DQ1`u;Auf|J>p3y-QVmZ&NfWecV8g<`>lOb7ola;)oGgjG
zmrJYe8Ae=A|CuXu=fJ_8y)rYuaC&B8a!7&k%k-6>;VBZtIJRP$9DCK3b+_u+jiw7R
zCbY}dhUW?=1zxQP(Fk-lg#L%#PK?AOFVu^OfhY8wB#GyW57R3&m1z1vJKm}@w3qI}
zi<7O?p+^CLs&-C7A>6wGb^xR|BBHA5FJtl^5ot|71UAPq#tdS428<C736KeWr63F)
z)@2p-_Mt60OI>KJ|NlTEbR~dB$V5s-1!l(BQSfLItRj^NkhhYAiVND4ZYe=BL1(A5
z1D&Y=a2(hqG3~}cDh-gcIM||$K)90K1v3U%H9;n+Ey9(4E(O7(QX-is831`qK`~&g
z4DMPW<B-u1&jqkMqTZ0m+^2~wey};-vH{=eojj9x$R?3obTUW-x}PM8jded3$z<)p
zb`HIh)B;Hf<P=iQq5-Jw--Rjyl1Ua1eSKe$xyPJ`pv)M7be0!=kYI*H->Pv^3-W;O
z!5R4qwjd(9cLc>p5Oj!fjWS+95RvJ<60W5?Dd>%u39ox-^Ey?h;0{dG5uj7WJHJXv
z?u<$&%`n*&4x9{ho0mX(FG0TxVw$RzHYxc+sR^m#N1+9|h<==5Q1f|Tu9v}IK|eQL
zCG|EqeFeyK(`OfCnMS7Xa{5X_yv(#4kYo#}7%+9h53)qTbqZVx)(|+EeYnKwyU<u)
zTBdn<vyRcMI4Q;e#cE|0oJbY<P_h8%fythxK9;Btkp87&2eh2Q<%X=Z8g(C}D}wJK
z((RTB?)J)@egee`h-atPV7FGM#9^f{H>9CGC!;<`U_O*gD}13+a)sw|9a5XzQdwb)
z>k$j(txAdV(AYc{8e4cakK+xQv(qDEjZ`F&K>|ET!=dd3Id+Q*WqAJ*op~e+b`U~}
z<sXuPa{7cm0mN_!$N;(#AczNy38M3cY@z->#1KOUkrXD=bY_+a*g>j=zHPj9k~kTF
z$HM@0pa5_;<_?slJ28@&wxP>|1fxR<0;vcN3i-R#3bXsv3Z&FGXF^@Rr$0`5QbM|N
z3}c2SgiJX@F<@C)Y05(sx1lM96=gE!Bp0EsX4!)9Y~63H%VHDiYT#pwiqz8DD(m3F
zLEeXQYk#x<j{YMah_prtpw7p1xs6-}RwN>Q|EoVwf4_06Y$MhA+ov^xTLvu{RE$9^
z55^yCpB}`<G{nLFW8vNawj$F2^hHYl+)nve!XO1}kJauYeG)KGCa_j5c?cXuJbGtG
zp{-ff<RL#6^s!)ILT}UO+d&4pC<q!T*Mq(>4Y?2lcH*d&#*;xl_>xg=QEkZ~!m~HE
zz&=N!M?dBQ9S}H@0nB=ka$kE6^T@S_NPh#3PCm#%*svzhe|yAF1|z`$#?VC^bNTIH
z5aZ;6A=b{Q{*kAIjR=_$52BbAtc;4?b=+t*=kYK(Tf$L$?GWYwrkS+w_$si_n1e=h
z_>!?k!i=uEB!2zfSZGWgl^fLi4GK0X*rI@nRY1IFm^w*%c%s73;c#mI3wc`WVbXA1
zCuxz)46KouI!QX(s`nfsod%Txcrl12jI}OPZ*fwwKpIlgO}f*?9Iy(V-c1CRx_pDG
z+BKKt6Zt75CP%@}s{`wWNdj&qv@o12!6l40fiN+hFo`ara=Qj)Or;)XI|He?Iw`-=
z1b;zgPUd>U_o0P~lJRI9`FV^hKS9AsnvM=-4a7Gk7XgE**>&WkEWiio8JLk5<6a93
zu83u-gA1IydoBMI14dkm#R!LxPYxVQ7KVsJ;8;>n=zwd%FR#nLj@lh5h#6KoGk55C
zlu5+u{1JNUqA1b;vuW*NoEfVfYun%<*!TubWDFGB4&o#RgBt<GUb9%((q}+3SuBML
zyX><RIhjxd<mb>~7%Q{91!7q#uL7}q_gaU8-#;W|>BfP>l*T7`Jb8Sgd>eg7Sme&B
zeQF6htKDz<T_oTWWdKffhEo^~fiqw-Y+HcS7-JZeymlMk99J?-02RWR*6st$TlYbN
z0bgSV#wff@<U76*qyg<2!Uq!?^wf|@SnqnG-OoDUEa8v#0C=2?fYJf5{RK!bz#4TU
zND*EDhKeI684N~vM65j&#5gyB+*FkN5U>+)3rS{VnGV3$jgslop83&0Pney7KHmfM
zFs+S6z}~aUKZUA2NrGzm1q3-PviuoDT92{??Z6(~3!s_V!ddGcGnT#I)g>tcCT#`i
zw`hPX6g)}68x+tM!rJmQ#p$RhrX{XGcMqB(P|lG^Z~$b-?=?rT2OxC!!eTFC5C<Ax
zC{Cb+B?BR;nXf~o5v9~na+T`YG~U*+=zaXaVuks84LwLllr+*L{wvGs0AQ8W04jvS
zO&>AxX4a7Jpw_;vBylv3huMYCqNhOf5=*4iQ0Esk4<}EDNt;fyN<p~>dEfAkQaxYm
zsM|nQpx6Rqp>l|!&_xXAlFvL-&%-z(fNwhSIDKF~a4KPYiB8`&z(p#E0WQ7+3k|sZ
zAcgpE(z)+xmq9$MczY;gV6Oqi%pn#J`pFW46P#e1NFFhqcjOI2xf@rMaNFSca4<xa
z7F2x%we2ye--0+(`B8!!q+yTY^jI(=66k3(7^C`t#@ix^nIR4TFZgr@DX>e>2>@DB
z_@X|Fv1D;+?RJp%Ztmr-Ar4qdeE=*G@5Hb)&;v`lBAPvC;YY#IkuDrPsi;5^2LGb6
zLL4~7_kyW?2ZQ*?E@8jtyv!eaUPn9gx^o!4%9{wzGrTVS-tW@i|2VZU8E1B}2X5b>
zs(+b+zk+~t!Ne_3jx*Fc=H@XE!Es3K5&hddwii9_WYt%H5E&$UP`yZg5LNJ{UG^a~
zK{%awln-sCzYNz0$}<}n!)yRN5j#$?<4%Hf0kVjKD2CEbUbhtWQmP(l-bhKX$vQYE
z+wGjwJzLBiPvOtoMfeqI-We<p*;Oo%<E)v$JE!NEEay!k+Dy20vbgZifVzQY3Rq(J
zM>QZx{B877&QM>`AMF)spBOc?3}%cou<B>=^y3-8GkDu*<=}7uLI>go#TQg=r1}Hf
zd>{D-AY=uAd5b_3x_B_VLn}6(_>zGz0r5Z2`tv*(>OLq0b)=y@@Uvuk+=VWDWdMqY
ze2`xmgyuaKY59i%xG*^~2+jrM2F-?50BdXlF;)VOcJfs&)!_WGV00%3p?)A3<M&_?
zzpZ<Pz?T2h9|}f+?ndz*!+R`<0mKu2KFZCjTz?qg4?`(*z@vzdMe#B2=doZEM0Wr}
z0QLH8Fox71$aH3BgiOmo6BGl>4hJdBJempB{X$@4v^vJlW9&SS9bjxuVVrz4PM&-I
za*$W!&~EJY4iq|$XCg?$O*s#RrZO6Tm#kYNKB~bxDe<=1zRw>GvOs+x{a`BYBPTf^
z)o~c1slEZHn!Wl-)IWs!#A>Mehq!)!d!i0f5sjBc`FJp~XuS-gU}^r?ZDY&Vwf6mR
z(LC;t?@WkPcLsgI{p1-%Yd|}<gderDwO5d8-~SW$lTMx9N6BH67?AYLoeMaM=ifD8
zE@SJ16Dw7l%ka&Zd*KXA6HcrNm$4!<2CZbV>Mr_IE6t@=swm0FgX1IY8C8fBaR7NZ
zUoE-tt~ybeye~|$5sPxd6tTk1$|l5E5=i}4Xe*<KB)k|V$(nY33+7EZi?k#fAI7~>
z4OSCR654c<^UJV}5bH?}SnR;oqoCcBLo&)FfUh_Xvw%|MderAt3P`+X<sUOI;V2MQ
zRjDG1p1VXk8#c&<$?46q3uSMk9vbjfia~&G$jQS_rq~pVMbRj)Q{AwSmq@W6p(&t^
z=~tG4u2PAWstz2udQ}s}26qi*iLyFG$pmcFH(<QEA-_b^{4xc9m4Y<{&LC+@_RZ4i
zj}{(SnI_`FO$EEe@koC<z<br3lOdj*t1XwRi%yo3suHEi3yv)5*eb=+(N6H5ILW<6
zsh$R-WTf2B(Q)_T*gXokT{KH&jUrzyCz|D6PN?7Iz?JT3duf8N5}qdJP_xLZg@3@%
zq}m-L(a9v66>L>-iAxwZ%GDd8nFekKUWeu<ZBUubHIQ#)p)^hb!&|0})&pc&eLsPE
zD#j(KGXUL@{4I?9UUKRPWL_wuj_lKakmS;bhtd2mV4^Im5ISeSnH{pln9vo&;0Yav
z!SWg9*s$g3Bp(P!DL~Pr+3n3WITyNJ<iZrXt9ybqz=**K4AvN7Z5y}sw??2rNd-_n
zf!F&1`iBmMXOJd>05crDGfWsV!iE<gEI;5xGsKs|1e*kZnFWsptuOTpM2NbAEJ+!^
ze`NsL2g(6ghC35!++InE>@CQVq8~`p5(6;l{Qw+j-?%1!AP7yzIIo4agCKA@SbF-Q
zh1SK;&Jd&_)Pw0bBl56w(K8I~j7klw6eQIF*o8*Kuo%4+$9LY<8VH?RZ0lUJzf*Iq
z1!dbn*MBI7djq=nv%TszzaM(+BnT~(RAK-~ajf-7VZH<(Qu5L$C|xHo0J)Z8mkThx
z6s~XaE3}YTe9xNlH+_Uai}J5w%jJ0r0tEY5KahGhiO%Eg<q<GTnr1a3c={f;5AJU!
z#2yIaKaFak-aNp;uypr39qzAn7_Ou49MA4v{AbI^q?AJ4R5Kevr<}0>3mAG)u0JgE
zVMvnn<kt~&3RxDUU`GB;grrHv-yfZ78J}yb=G-BD7Bo=Ya%4{<wC6w(CRohEqK1j<
zCC_F5%zm_jmyRbY@O-JQ;w9UZm2`nlNt5q7cFFU%nywQAulKRz@{8Q!h9pJ*F~prD
zdCDj~bN>95nT6to>ACp})2|fgFJ7L#H2oPk9<BQeG^|Yyw;*$us0;WxaVL|xFhL3@
z(vLbOV)Bz*jHxhIN_LdoWWPr*aPp<9T*fiD<Km0xBybmLigh{+^+lFI<=;Y|@&r#8
zJF7Me6H^9k$6AE$3(isqi^@!WP)WD9#or{P_cVIafRrGCLIx#&U$SzMSw4l-A%*I|
zvL=AoEd3}vfo(9TiT5A1<iA79eVA$j8C^{EZS)?*$it6(fj2byP$wS50E=V=20K+h
z;Tv@SOv#+kn`kR=$QI_R;a#G*fFp;nV86cRlkcAf2cS4`N2;!T0V$oJw1_E*6jCYd
zTF}5iUS!rO4P7rR*CMfMD27TTZzX}nV0-fW$g}UQp92obtPndp2n#mJsxer*a<Eu~
zwdr~TA}&&I!fh282Jj8vx(}$qn4|BOg?drXu#!<MN3Ja*GY)N#fc6KY4S}5;0y}B%
zQ{^k{a;6u%2x!_W<VMBo8Ne@^*N2>4u$K5D@(0XA-X=zrU2H`^EO8@XOf|6Lz@@P9
zjrt?ZDvyC(920{gcT*EXVExDaG1M9txE08HCB)eqaAXFK&g^*$hkP7<PyQ_SSSg1I
zR+kp}?|Y|~l<NKuPc5)d75o}LOcm*zDrcxCC`RZEkWK10`P&pQ&iEb5H4pG8s774M
zKD<Y@3HLGHBV`^LO~#4+G-jBsWbB5P3?l~)e&S@cRJ$%p&yAo9rOcZA5!_lY?o(}G
z&o|*-E`J__${hp{bN>NeVa5Xk37oE6dD-*zUY5O%V+lEx90w~IMqDL1nh<|{iu$q$
zIfd}at2G(^a|?(yBy3yfaOa>5pW>}O9LWC1l5A28hw`6LY?}g7^0FR@CC1RkJq&VC
zVZGXfV#2;eRSvL&{mgpqu}o^GAE%m+P(T|<3UzQxMY(icK0}$$Qt)vKc&7>9$>$I_
z{1x!8m-1gx-oK&XHU)1{z<Rx1#5yjRtOn?{5jewY+6OqngXHU1(8urNSa=JFXh2;+
zVJ4aDv&47N57!s=ehC%-->D4Q?jAB9H6PF)HFNmw)j{k%I|Vu293X`pjj-<!k}|F<
zb<;`4A%s({2PqqVZsck+BH&2dYWcWtvI4e=k=c_J?;^8vY?9J^bA=F&4rE3qDoWdw
zCf|OR*A1XCgA7Wyj1_n^`e3!7z9VN~FljLTCs&9`Vpkgi1YDVjMbh2C)<1)6XG69-
z><{kb;9O&OuHW&sJCyx|Euij#9EVs}j_XsGELy{_PS=|LR)P1s5Q#Fc?EyY4#r`B@
zJudga^|K=&+)?Y;HxKuQoFQ+uf@>%6_^rU;>o-<W)GFL1-|ZU!_h`mmy?2$@CWk_c
z+(7OHUh+R+ALJiUK;j>)mk|GyZ`|`phiQl(@Rnzf9FLtU)tNp`l@m+wL}C6QeZAzD
zmy1GOQ~D+f8OU)9p(N`NM&W;-Q2-Dvi2RS#K?D@dN>%<RN@qG9!s$d{ZT6Bx_2oaJ
zeh(n0LZ=Qp^cL9{bl*t#18I4O&{Bi)hz>O$a?tHOM2j3~Gf{2%pHW`!wd9bxh*pGU
zht~lpPzT_kkrF}vA}&sSm5t4xhcc7xI%GrL=d1}|d>?vdT=6jYZEqU}jv0A<fx5<#
zYk=d0-xhMAH3rR%t?FK$bhhx!YOdwUS`j4PL=QncQt$ME%J+fdr2`9x9!HuC+4UUJ
z{{6Y&>XmZD2}~$nE(9hdkefYo)&BzK`fW8=^nZBm+n}32&TPNUvn98~o^J@qZfZtO
zpjc`0E+m!6o{E&WN4`Nt87IZkFYmF_r^H`Q$lstgze&OGQLsV50lVv0D39a=C*3Q<
zgMiTaI&icm;80xm%Cd4D4*1YEiwc<M(pC}D^f5YAgu*pu@W@b@BQ}sF)I4O|EZ9DB
zaH88xsw4*t+AY!LAERySW6QqZ^iCW(vb<g^)k~GBMKbrY-s4C~Im}gD@5qwZC?7w1
z{K=_hzgBHM`vHx3A-p4Jr{`v#xG;bIi5KP@XP<yuTVtwOUy}cxK70c1S{s$dy2oxG
z`?MJ6;UuyyCDbXbrf@Rdszl+O96V=n%LWvOh-{I#?^bH|-1)*woZlLpcdH<_g;Ies
znGl=M(SWP?L;Bd<tn$1j-P9G<x_B+?-0Z~@caEdD@;G*0xdRb<gv)(wVrImHXlYa7
zAo*Do0-gD8vo$b7uAhaj58#Pbdfw$U`Q@BoVd~BssNc%YvC^lYT<<(tM5be(W0g-U
zI}cq?VXkzeFpICmg{e!>?iA*GbWp8BcV(fj#P>t~ff8(18O1Aqice@IFIVb?m)Qpx
ziZ!x+%Q}XOL^kdDrO)Mm>4iUT-8|(ayEBh?z<+VdNzIftDocC<oIW4^zjRXxvjUe#
z%d$sCTAA5sA9>oXKAL=ChRtuS<P46p%6~v@PP8e0qX4N1*Qg5h?l@Cr;tV@~M4*XK
zlN!$>hDZ?MB#s$SOIU=kAe_)GkWmoL73GEwOb4Ynhfs>+k|;Q1+lQ|Q`OmEYr>!KR
z6u03A3wed42PVb1apd={^n-B6gZK)R?!t~Za<ZZUJHjUQMd)JeXJC6<1L+p=P7D|W
zZsUY3<TntUm%l*KcPThR0WH?MgUT5*MJouWn)SLb{|*)YT?&4Yg1<)rp?UdB6m&J7
z^6yjf7zM;1^@!5HOi98{lPM6#9u1`Y7BWM76%=m?VyYT$m1_S(3Vxk}rzv=m0v_oA
zz8N9S>_$cU>(Q>OIe&w24Sf%A4Vytpvz7-|Q5Z(vLCHRYeHt0vEhGaKwvaB7LZs|$
z<8A%55x4@;M$+9!T7I>W25%&X-Hl8{8=1gHCU_&sp_!Z;I~xg?p=cwqZTmJ7&W_N+
zr`Vc7q>Q+{--1IV2q_7OaDucuRt*?3ZINI-KJ@a7AdGbX7;38oHXTQe+x}Unt!mk^
zeDt(U-Q9K#!Xvc?sd@nIyW_kKtI7UR)^ef`M=SjSN2?WMNaGXMiWM$F&D*jIbEJre
zFx86BG+6U4|0{N3GA+M{my_x2YNamRO+G2|`&5wNqe&NNV;f+3HkG2{$2~9u2M^4z
z(NTFA9n(=EqNLQYbXZa#NRN~96(L<s8bO)-Z>Y&L#07L4IuYD+c37W6@>DBLXk1}@
zu$M!MyQDN>aFm@WI713Wbv}>2#&dGLN%%VAlbu8dTeZ?x)d^?x<XD8MoJ6OE{5H*q
zA$SL|mhsqQ?2NhqjyYZ?pYKN98Cr)+HF*%xbswp`kXqRXAAGQY+ed{fEN-{*bL(|Z
zLu<IOT=AmeNE0r9pSm8LbtUPdm>iv*o0^(x9XVTtPfY<<(Zcn0_$$>5rRy-37JxP7
zUT<)`@py};T6t_XlU%A2u?JJFCuXZIbZZ4gE_=vffw)udo>&<40e|i(VD{JPqseqE
z-$VfY9}CN0rMNEt2E9!AkMWwBnQTKVi7RP@rPXCxlB4)CRG26#x?EHjr20|dB+t_S
zBB1+K@}D9d+LgKoPf~R;Fwb{wr|4D^To=75TnMh$VZx2lPK+~f3$Rfox{jsyB(cac
zq^@JE-QZih@?(^Hlmf!4jyZerlESJs<uMv18n4jkMXHi!-b!7*_xK(cU)!Q9<#Y<+
zN}>b^Tm+`uAbg#~>BoN#PzDt2{$gcG-3}{If7x=WyiC_XJosDU=HnC%N4f#Nh$Ww=
z*l7wLL4ezif@PdAwutkrl#zT{MVY2%sA83Z76scB5GiC$z@CDD{_6k@3Wlx3b_k_U
z_!X*2@&xmE4(>HBHHz!9>hw42%yf1#<abcXiF^201=mZGE(d|Rl1_%XtBBV^GKwj#
z%dx#G>f_Q7OkDi04~7nyxj1u_Z1M;0y>LMS6E3fk$sZS+_Zh-A=-((rRxpaEJ0>u0
zH{8oEGkZeWAagkC(t+`f-2%BP`EDzq<RpBzi3w6gU1J=#h8tjYy@q>Q7BQL;GK9_<
z|2KfJf~|niNh_-!FbVW%^4G9vp;f8l>=5NsIP60dYf}kiQeQERac{j$H~r){sgPyI
zU!@vg9ve;ITS8X2Ck~?<gRrC61inEbJyh(q>8TpIyX|N_GBq&@PIL{5wN+42ISG9I
zs%YG(J9MWPSgQ*E3*aC`6gTh()G7}2LSh9D1H3hW)L4QEbzlB-6!*v_%rOihFHD@o
zZAJVuhv$d~@~$By!&)A!L7K&o1aLmQq@anWeDZB1+^^ngsCp9FL?6s_4`v@jIGDD^
z()r}rME=8xWNIuGON}RvA^&RXfyBi`KJgJy6PW8ruibeDqIk|q8zcN1FrptZDKO{J
zJm@zDb0Gg<*rPlpaUaLqW~CB&a~c1~j#Cb<%Ii-WFb8H6V??`*?)MDnhcN>KS8PGO
z%s;=E<4{b|_ZmM;#7QiJagm=i)LUdmoWNDw2{@IEKvW|WC20aq;7MTyG<URq--64@
KQR8u}*8c<N+)Aea

literal 0
HcmV?d00001

diff --git a/RenAIssance_Transformer_OCR_Utsav_Rai/code/app/app_streamlit.py b/RenAIssance_Transformer_OCR_Utsav_Rai/code/app/app_streamlit.py
index 7770a801..c5958cf3 100644
--- a/RenAIssance_Transformer_OCR_Utsav_Rai/code/app/app_streamlit.py
+++ b/RenAIssance_Transformer_OCR_Utsav_Rai/code/app/app_streamlit.py
@@ -1,9 +1,11 @@
 import sys
 import os
-# Add CRAFT directory to sys.path for craft imports
-CRAFT_DIR = os.path.abspath(os.path.join(os.path.dirname(__file__), '..', 'CRAFT'))
-if CRAFT_DIR not in sys.path:
-    sys.path.insert(0, CRAFT_DIR)
+
+APP_DIR = os.path.dirname(os.path.abspath(__file__))
+CRAFT_DIR = os.path.abspath(os.path.join(APP_DIR, "..", "CRAFT"))
+for path in (APP_DIR, CRAFT_DIR):
+    if os.path.isdir(path) and path not in sys.path:
+        sys.path.insert(0, path)
 import torch
 import torch.backends.cudnn as cudnn
 from collections import OrderedDict
@@ -17,7 +19,6 @@
 from PIL import Image, ImageEnhance
 import cv2
 import numpy as np
-import os
 import math
 from transformers import TrOCRProcessor, VisionEncoderDecoderModel
 import streamlit as st
@@ -25,6 +26,21 @@
 
 st.set_page_config(layout="wide")
 
+
+def resolve_existing_path(env_var, *candidates):
+    override = os.getenv(env_var)
+    if override:
+        return override
+
+    for candidate in candidates:
+        if os.path.exists(candidate):
+            return candidate
+
+    raise FileNotFoundError(
+        f"Could not resolve a path for {env_var or 'required asset'}. "
+        f"Tried: {', '.join(candidates)}"
+    )
+
 def copyStateDict(state_dict):
     if list(state_dict.keys())[0].startswith("module"):
         start_idx = 1
@@ -39,7 +55,11 @@ def copyStateDict(state_dict):
 @st.cache_resource
 def load_craft_model():
     # Define the path to the pre-trained CRAFT model weights
-    trained_model_path = '../../weights/craft_mlt_25k.pth'
+    trained_model_path = resolve_existing_path(
+        "RENAISSANCE_CRAFT_MODEL_PATH",
+        os.path.join(APP_DIR, "weights", "craft_mlt_25k.pth"),
+        os.path.abspath(os.path.join(APP_DIR, "..", "..", "weights", "craft_mlt_25k.pth")),
+    )
     
     # Initialize the CRAFT model
     net = CRAFT()     # initialize
@@ -57,7 +77,11 @@ def load_craft_model():
     refine = True  # Set to True if using refine_net
     if refine:
         from refinenet import RefineNet
-        refiner_model_path = '../../weights/craft_refiner_CTW1500.pth'  # Update the path
+        refiner_model_path = resolve_existing_path(
+            "RENAISSANCE_CRAFT_REFINER_PATH",
+            os.path.join(APP_DIR, "weights", "craft_refiner_CTW1500.pth"),
+            os.path.abspath(os.path.join(APP_DIR, "..", "..", "weights", "craft_refiner_CTW1500.pth")),
+        )
         refine_net = RefineNet()
         refine_net.load_state_dict(copyStateDict(torch.load(refiner_model_path, map_location=device)))
         refine_net.to(device)
@@ -109,9 +133,17 @@ def test_net(net, image, text_threshold, link_threshold, low_text, *, cuda, poly
 @st.cache_resource
 def load_ocr_model():
     device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
-    # Update path to point to the correct location of the OCR weights
-    model_path = "../../models"
-    processor_path = "../../models"
+    model_path = resolve_existing_path(
+        "RENAISSANCE_OCR_MODEL_DIR",
+        os.path.join(APP_DIR, "models"),
+        os.path.abspath(os.path.join(APP_DIR, "..", "..", "models")),
+    )
+    processor_path = resolve_existing_path(
+        "RENAISSANCE_OCR_PROCESSOR_DIR",
+        model_path,
+        os.path.join(APP_DIR, "models"),
+        os.path.abspath(os.path.join(APP_DIR, "..", "..", "models")),
+    )
     processor = TrOCRProcessor.from_pretrained(processor_path)
     model = VisionEncoderDecoderModel.from_pretrained(model_path).to(device)
     return processor, model, device
@@ -771,4 +803,4 @@ def get_virtual_page(pdf_document, virtual_index, dpi, **kwargs):
         st.write("No image to display.")
 
 else:
-    st.info("Please upload a PDF file from the left panel.")
\ No newline at end of file
+    st.info("Please upload a PDF file from the left panel.")

From 09057836c329194e2b671db5e537a28e176bf7f8 Mon Sep 17 00:00:00 2001
From: sushant khemalapure <sushantkhemalapure@gmail.com>
Date: Wed, 29 Apr 2026 18:31:43 +0530
Subject: [PATCH 2/2] Make self-supervised OCR config portable

---
 .gitignore                                    | 10 ++-
 .../README.md                                 | 76 +++++++++++++----
 .../check_config_paths.py                     | 85 +++++++++++++++++++
 .../config.json                               | 20 ++---
 .../data/.gitkeep                             |  1 +
 .../data/README.md                            | 13 +++
 .../data/finetuning/.gitkeep                  |  1 +
 .../data/finetuning/ezcaray/.gitkeep          |  1 +
 .../data/finetuning/ezcaray/word_images.csv   |  1 +
 .../finetuning/ezcaray/word_images/.gitkeep   |  1 +
 .../data/finetuning/perfecto/.gitkeep         |  1 +
 .../data/finetuning/perfecto/word_images.csv  |  1 +
 .../finetuning/perfecto/word_images/.gitkeep  |  1 +
 .../data/finetuning/virtuosa/.gitkeep         |  1 +
 .../data/finetuning/virtuosa/word_images.csv  |  1 +
 .../finetuning/virtuosa/word_images/.gitkeep  |  1 +
 .../data/ssl/.gitkeep                         |  1 +
 .../data/ssl/word_images/.gitkeep             |  1 +
 .../models/.gitkeep                           |  1 +
 19 files changed, 192 insertions(+), 26 deletions(-)
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/check_config_paths.py
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/.gitkeep
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/README.md
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/.gitkeep
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/ezcaray/.gitkeep
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/ezcaray/word_images.csv
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/ezcaray/word_images/.gitkeep
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/perfecto/.gitkeep
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/perfecto/word_images.csv
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/perfecto/word_images/.gitkeep
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/virtuosa/.gitkeep
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/virtuosa/word_images.csv
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/virtuosa/word_images/.gitkeep
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/ssl/.gitkeep
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/ssl/word_images/.gitkeep
 create mode 100644 RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/models/.gitkeep

diff --git a/.gitignore b/.gitignore
index f5f96cd2..beabcb52 100644
--- a/.gitignore
+++ b/.gitignore
@@ -1,3 +1,11 @@
 RenAIssance_Transformer_OCR_Utsav_Rai/weights
 RenAIssance_Transformer_OCR_Utsav_Rai/models
-RenAIssance_Transformer_OCR_Utsav_Rai/quantized_model
\ No newline at end of file
+RenAIssance_Transformer_OCR_Utsav_Rai/quantized_model
+RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/models/*.pt
+RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/models/*.pth
+RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/ssl/word_images/*
+!RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/ssl/word_images/.gitkeep
+RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/*/word_images/*
+!RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/perfecto/word_images/.gitkeep
+!RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/ezcaray/word_images/.gitkeep
+!RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/virtuosa/word_images/.gitkeep
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/README.md b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/README.md
index 4870d4b3..8a6d693a 100644
--- a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/README.md
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/README.md
@@ -1,24 +1,70 @@
 # Spanish Historical OCR using Self-Supervised Learning
 
 ## Overview
-This repository implements a word-level OCR model for Renaissance Spanish documents using Self-Supervised Learning. The model was developed with reference to SeqCLR ([Aberdam A., et al., 2021](https://arxiv.org/abs/2012.10873)). According to the paper, SeqCLR employs a Contrastive Learning method, wherein its encoder learns to become robust against certain image transformations. The architecture includes a combination of ResNet50(or ViT tiny) and a 2-layer BiLSTM as the Encoder, and an Attention LSTM Decoder. At this point, the model achieves approximately 4% CER. This model can be tested in `test_model.ipynb`. For further information, please refer to my [blog](https://medium.com/@yamanko1234/historical-ocr-with-self-supervised-learning-c4f00da6637f).
+This repository implements a word-level OCR model for Renaissance Spanish documents using self-supervised learning. The model was developed with reference to SeqCLR ([Aberdam A., et al., 2021](https://arxiv.org/abs/2012.10873)). According to the paper, SeqCLR uses contrastive learning so its encoder becomes robust to image transformations. The architecture combines a ResNet50 (or ViT tiny) and a 2-layer BiLSTM encoder with an attention LSTM decoder.
+
+At this point, the model achieves approximately 4% CER. This model can be tested in `test_model.ipynb`. For more background, see the [project blog post](https://medium.com/@yamanko1234/historical-ocr-with-self-supervised-learning-c4f00da6637f).
+
+## Portable Configuration
+The default `config.json` now uses paths relative to this folder instead of machine-specific absolute paths. That makes the project easier to clone and configure on another machine.
+
+Populate the directories below with your local datasets and checkpoints, or update `config.json` to match your own layout:
+
+```text
+RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/
+├── config.json
+├── data/
+│   ├── ssl/
+│   │   └── word_images/
+│   └── finetuning/
+│       ├── perfecto/
+│       │   ├── word_images/
+│       │   └── word_images.csv
+│       ├── ezcaray/
+│       │   ├── word_images/
+│       │   └── word_images.csv
+│       └── virtuosa/
+│           ├── word_images/
+│           └── word_images.csv
+├── models/
+└── test_images/
+```
+
+The bundled `test_images/` folder is used as the default `test dataset` path so contributors can validate notebook setup without first changing that entry.
+
+Before running the notebooks, you can verify the configured paths:
+
+```bash
+python check_config_paths.py
+```
 
 ## File/Folder Descriptions
-- **Tokenizer**: A folder containing Tokenizer pickle files for the Decoder training.
-- **test_image**: A folder containing images used for testing.
-- **Decoder.py**: Implementation of the SeqCLR’s Decoder.
-- **ResNet.py**: Implementation of ResNet, a component of the Encoder.
-- **config.json**: A JSON file that sets the configuration for training.
-- **custom_dataset.py**: Implementation of a custom dataset used in training.
-- **decoder_training.ipynb**: A notebook to train the Decoder.
-- **encoder.py**: Implementation of the SeqCLR’s Encoder.
-- **ViT_encoder.py** Implementation of ViT version Encoder.
-- **encoder_training.ipynb**: A notebook to train the Encoder.
-- **test_model.ipynb**: A notebook to test a saved model.
+- **Tokenizer**: Pickle files used for decoder training and decoding.
+- **data**: Local SSL and fine-tuning datasets referenced by `config.json`.
+- **models**: Saved encoder and decoder checkpoints.
+- **test_images**: Sample images used for testing.
+- **Decoder.py**: SeqCLR decoder implementation.
+- **ResNet.py**: ResNet implementation used by the encoder.
+- **config.json**: Training and inference configuration.
+- **check_config_paths.py**: Helper script that verifies configured dataset and model paths exist.
+- **custom_dataset.py**: Custom dataset implementations used in training.
+- **decoder_training.ipynb**: Notebook for decoder training and evaluation.
+- **encoder.py**: SeqCLR encoder implementation.
+- **ViT encoder support**: The notebooks include an optional ViT encoder path controlled by `config.json`.
+- **encoder_training.ipynb**: Notebook for encoder training.
+- **test_model.ipynb**: Notebook for testing a saved model.
 
 ## Testing the Model
-First, you need to install the dependencies:
-```
+Install the dependencies:
+
+```bash
 pip install -r requirements.txt
 ```
-Then, you can test the saved model by executing the cells in `test_model.ipynb` one by one.
\ No newline at end of file
+
+Confirm `config.json` points to valid paths for your environment:
+
+```bash
+python check_config_paths.py
+```
+
+Then run the cells in `test_model.ipynb`.
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/check_config_paths.py b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/check_config_paths.py
new file mode 100644
index 00000000..5026b2d3
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/check_config_paths.py
@@ -0,0 +1,85 @@
+from __future__ import annotations
+
+import json
+from pathlib import Path
+
+
+PROJECT_ROOT = Path(__file__).resolve().parent
+CONFIG_PATH = PROJECT_ROOT / "config.json"
+
+
+def resolve_path(raw_path: str | None) -> str:
+    if raw_path is None:
+        return "<not set>"
+    return str((PROJECT_ROOT / raw_path).resolve())
+
+
+def path_exists(raw_path: str | None) -> bool | None:
+    if raw_path is None:
+        return None
+    return (PROJECT_ROOT / raw_path).exists()
+
+
+def iter_config_paths(config: dict) -> list[tuple[str, str | None, bool]]:
+    return [
+        ("SSL.dataset 1", config["SSL"].get("dataset 1"), True),
+        ("SSL.dataset 2", config["SSL"].get("dataset 2"), False),
+        ("SSL.dataset 3", config["SSL"].get("dataset 3"), False),
+        ("SSL.saved Encoder path", config["SSL"].get("saved Encoder path"), False),
+        ("fine-tuning.dataset 1", config["fine-tuning"].get("dataset 1"), True),
+        ("fine-tuning.dataset 1 csv", config["fine-tuning"].get("dataset 1 csv"), True),
+        ("fine-tuning.dataset 2", config["fine-tuning"].get("dataset 2"), False),
+        ("fine-tuning.dataset 2 csv", config["fine-tuning"].get("dataset 2 csv"), False),
+        ("fine-tuning.dataset 3", config["fine-tuning"].get("dataset 3"), False),
+        ("fine-tuning.dataset 3 csv", config["fine-tuning"].get("dataset 3 csv"), False),
+        ("fine-tuning.test dataset", config["fine-tuning"].get("test dataset"), True),
+        (
+            "fine-tuning.Encoder path for fine-tuning",
+            config["fine-tuning"].get("Encoder path for fine-tuning"),
+            False,
+        ),
+        (
+            "fine-tuning.Decoder path for fine-tuning",
+            config["fine-tuning"].get("Decoder path for fine-tuning"),
+            False,
+        ),
+        ("fine-tuning.char to token", config["fine-tuning"].get("char to token"), True),
+        ("fine-tuning.token to char", config["fine-tuning"].get("token to char"), True),
+        ("fine-tuning.saved Encoder path", config["fine-tuning"].get("saved Encoder path"), False),
+        ("fine-tuning.saved Decoder path", config["fine-tuning"].get("saved Decoder path"), False),
+    ]
+
+
+def main() -> int:
+    with CONFIG_PATH.open("r", encoding="utf-8") as config_file:
+        config = json.load(config_file)
+
+    print(f"Checking paths in {CONFIG_PATH}")
+    print()
+
+    missing_required = False
+    for label, raw_path, must_exist in iter_config_paths(config):
+        exists = path_exists(raw_path)
+        absolute_path = resolve_path(raw_path)
+        if exists is None:
+            status = "OPTIONAL"
+        elif exists:
+            status = "OK"
+        elif not must_exist:
+            status = "OPTIONAL"
+        else:
+            status = "MISSING"
+            missing_required = True
+        print(f"[{status:<8}] {label}: {absolute_path}")
+
+    print()
+    if missing_required:
+        print("Some configured paths are missing. Update config.json or place your data/models in the expected folders.")
+        return 1
+
+    print("All configured paths exist.")
+    return 0
+
+
+if __name__ == "__main__":
+    raise SystemExit(main())
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/config.json b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/config.json
index 64209c53..2a0355d4 100644
--- a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/config.json
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/config.json
@@ -3,23 +3,23 @@
         "ViT": false
     },
     "SSL": {
-        "dataset 1": "/home/yukinori/Desktop/CRAFT-pytorch/self_supervised_data/word_images",
+        "dataset 1": "data/ssl/word_images",
         "dataset 2": null,
         "dataset 3": null,
         "epoch size": 1,
         "Batch size": 32,
         "start lr": 0.001,
         "lr scheduler step size": 2,
-        "saved Encoder path": "ViT_encoder.pth"
+        "saved Encoder path": "models/ViT_encoder.pth"
     },
     "fine-tuning": {
-        "dataset 1": "/home/yukinori/Desktop/CRAFT-pytorch/Perfecto/Perfecto/word_images",
-        "dataset 1 csv": "/home/yukinori/Desktop/CRAFT-pytorch/Perfecto/Perfecto/word_images.csv",
-        "dataset 2": "/home/yukinori/Desktop/CRAFT-pytorch/Ezcaray/word_images",
-        "dataset 2 csv": "/home/yukinori/Desktop/CRAFT-pytorch/Ezcaray/word_images.csv",
-        "dataset 3": "/home/yukinori/Desktop/CRAFT-pytorch/Virtuosa/word_images",
-        "dataset 3 csv": "/home/yukinori/Desktop/CRAFT-pytorch/Virtuosa/word_images.csv",
-        "test dataset": "/home/yukinori/Desktop/CRAFT-pytorch/self_supervised_data/word_images",
+        "dataset 1": "data/finetuning/perfecto/word_images",
+        "dataset 1 csv": "data/finetuning/perfecto/word_images.csv",
+        "dataset 2": "data/finetuning/ezcaray/word_images",
+        "dataset 2 csv": "data/finetuning/ezcaray/word_images.csv",
+        "dataset 3": "data/finetuning/virtuosa/word_images",
+        "dataset 3 csv": "data/finetuning/virtuosa/word_images.csv",
+        "test dataset": "test_images",
         "fine-tune on other dataset": true,
         "Encoder path for fine-tuning": "models/trdg_Encoder_9_13.pt",
         "Decoder path for fine-tuning": "models/trdg_Decoder_9_13.pt",
@@ -33,4 +33,4 @@
         "saved Encoder path": "models/trdg_fine_tuned_Encoder_withoutSSL_9_13.pt",
         "saved Decoder path": "models/trdg_fine_tuned_Decoder_withoutSSL_9_13.pt"
     }
-}
\ No newline at end of file
+}
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/.gitkeep b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/.gitkeep
new file mode 100644
index 00000000..8b137891
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/.gitkeep
@@ -0,0 +1 @@
+
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/README.md b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/README.md
new file mode 100644
index 00000000..3d78119c
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/README.md
@@ -0,0 +1,13 @@
+Place local training data under this directory.
+
+Expected layout:
+
+- `data/ssl/word_images/`
+- `data/finetuning/perfecto/word_images/`
+- `data/finetuning/perfecto/word_images.csv`
+- `data/finetuning/ezcaray/word_images/`
+- `data/finetuning/ezcaray/word_images.csv`
+- `data/finetuning/virtuosa/word_images/`
+- `data/finetuning/virtuosa/word_images.csv`
+
+These paths match the defaults in `config.json`.
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/.gitkeep b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/.gitkeep
new file mode 100644
index 00000000..8b137891
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/.gitkeep
@@ -0,0 +1 @@
+
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/ezcaray/.gitkeep b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/ezcaray/.gitkeep
new file mode 100644
index 00000000..8b137891
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/ezcaray/.gitkeep
@@ -0,0 +1 @@
+
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/ezcaray/word_images.csv b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/ezcaray/word_images.csv
new file mode 100644
index 00000000..43291c31
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/ezcaray/word_images.csv
@@ -0,0 +1 @@
+label,image
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/ezcaray/word_images/.gitkeep b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/ezcaray/word_images/.gitkeep
new file mode 100644
index 00000000..8b137891
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/ezcaray/word_images/.gitkeep
@@ -0,0 +1 @@
+
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/perfecto/.gitkeep b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/perfecto/.gitkeep
new file mode 100644
index 00000000..8b137891
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/perfecto/.gitkeep
@@ -0,0 +1 @@
+
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/perfecto/word_images.csv b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/perfecto/word_images.csv
new file mode 100644
index 00000000..43291c31
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/perfecto/word_images.csv
@@ -0,0 +1 @@
+label,image
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/perfecto/word_images/.gitkeep b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/perfecto/word_images/.gitkeep
new file mode 100644
index 00000000..8b137891
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/perfecto/word_images/.gitkeep
@@ -0,0 +1 @@
+
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/virtuosa/.gitkeep b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/virtuosa/.gitkeep
new file mode 100644
index 00000000..8b137891
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/virtuosa/.gitkeep
@@ -0,0 +1 @@
+
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/virtuosa/word_images.csv b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/virtuosa/word_images.csv
new file mode 100644
index 00000000..43291c31
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/virtuosa/word_images.csv
@@ -0,0 +1 @@
+label,image
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/virtuosa/word_images/.gitkeep b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/virtuosa/word_images/.gitkeep
new file mode 100644
index 00000000..8b137891
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/finetuning/virtuosa/word_images/.gitkeep
@@ -0,0 +1 @@
+
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/ssl/.gitkeep b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/ssl/.gitkeep
new file mode 100644
index 00000000..8b137891
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/ssl/.gitkeep
@@ -0,0 +1 @@
+
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/ssl/word_images/.gitkeep b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/ssl/word_images/.gitkeep
new file mode 100644
index 00000000..8b137891
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/data/ssl/word_images/.gitkeep
@@ -0,0 +1 @@
+
diff --git a/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/models/.gitkeep b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/models/.gitkeep
new file mode 100644
index 00000000..8b137891
--- /dev/null
+++ b/RenAIssance_SelfSupervisedLearning_OCR_YukinoriYamamoto/models/.gitkeep
@@ -0,0 +1 @@
+